ChatGPT는 인공지능의 능력에 대한 인식을 전 세계적으로 바꾸었습니다. 일반적으로 말하자면, 서투르고 기계적인 것에서 기괴하게도 인간 같은 모습으로 변했습니다.
번역 분야에서 이것이 가능성에 어떤 영향을 미치나요?
인간은 더 이상 필요하지 않은가요?
ChatGPT를 통해 모든 것을 처리하고 번역에 더 이상 돈을 쓰지 않을 수 있을까요?
이 기사에서는 대형 언어 모델이 제공하는 번역의 잠재력과 한계를 탐구할 것입니다.
ChatGPT와 대화하고 싶으세요?
GPT3/4 또는 기타 유사한 능력을 가진 인공지능 챗봇과 대화하는 것은 깨달음을 주기도 하지만 무서울 수도 있습니다. 당신의 프롬프트에 대한 답변은 놀람과 사용자의 실망을 초래할 수 있습니다. GPT 4는 90% 백분위로 BAR 시험을 통과할 수 있을 뿐만 아니라, 잘못된 사실을 만들거나 논리적으로 부적절한 주장을 받아들이는 등 큰 실수를 저지를 수도 있습니다.
매개 변수와 훈련 데이터에 따라 모든 것이 달라질 수 있지만, 영어 GPT 3과 4는 우리가 직업과 전문직을 수행하는 방식을 뒤흔들 가능성을 분명히 보여줍니다.
하지만 다른 언어에서는 어떻게 작동합니까?
더 많은 문맥이나 덜한 문맥에서는 어떻게 작동합니까?
GPT 3와 GPT 4는 현저하게 다른가요?
기계 번역 없이 기계 번역 시스템 없이
기계 번역의 역사는 기술의 한계를 명확히 보여줬습니다. 기계 번역의 역사는 우리 세계에서 기술의 한계를 명확히 보여줬습니다. 80년대에 처음으로 이 아이디어가 소개될 때, 일부 사람들은 정확한 번역을 생성하기 위해 더 이상 인간이 필요하지 않을 것이라고 믿었습니다.
인간이 자연스럽게 말하는 것처럼 들리는 번역을 만들기 위해 다양한 통계 및 규칙 기반 모델을 발전시키는 것이었을 뿐이었습니다.
하지만 그것은 분명히 사실이 아니었습니다. 모델이 개선되고, 지식에 대한 접근성이 개선되었지만, 언어는 너무 미묘하고 예외로 가득 차 있어서 엔지니어들이 기계에게 설명할 수 없었습니다. 모델은 프롬프트 및 응답 대화에 기반하지 않았으며, 엔진이 포함하는 영어 텍스트 또는 다른 언어의 입력에 대한 단일 출력에 기반했습니다.
모델 선택 및 번역 비용 추정
예를 들어 gpt 3로 번역하기 위해 모델을 선택하는 것이 첫 번째 논리적인 단계처럼 보일 수 있지만, 실제로는 번역 여정에서 마지막 단계여야 할 수도 있습니다.
예를 들어 일반 텍스트로 작업하고 그것을 간단히 gpt 3에 삽입하거나 openai의 API를 사용하여 콘텐츠를 가져오고 내보낼 수 있습니다. 그러나 이는 번역에 대한 주요 도전 사항 중 일부를 간과할 수 있습니다.
첫 번째로 분명한 것은 형식이 손실된다는 것입니다. 대규모 언어 모델 및 기타 인공지능 시스템을 더 깊이 연구함에 따라 지식 관리의 중요성도 더욱 중대해집니다.
과거 번역을 어떻게 관리할 예정인가요?
어떻게 엔진을 세밀하게 조정하여 용어 또는 SEO를 고려할 것인가요?
AI 챗봇은 얼마나 강력하더라도 원래 번역 엔진으로 설계되지 않았습니다. GPT 3 번역은 많은 맥락에서 놀라운 것입니다. 그것은 종종 사용자에게 인간적으로 보이는 번역을 제공할 수 있으며, 영어 텍스트나 다른 원본 언어보다 더 좋게 들릴 수도 있습니다. 그러나 그 자체로는 규모나 반복적인 운영이 거의 불가능할 것입니다.
gpt 3 또는 4가 제시하는 주요 이점을 추출하기 위해 인공지능과 깊게 통합된 번역 관리 시스템이 필요합니다.
Google LaMDA의 창조자들이 만든 최신 AI인 Character.ai와 대화하고 싶으세요?
구글의 LaMDA를 기반으로 한 Character.ai와 같은 챗봇 대화는 특정한 맥락 없이도 인간과 같은 대화가 가능하다는 것을 명확히 보여줍니다. 가끔 사람처럼 보이는 방식으로 만들거나 미리 선택한 캐릭터와 대화할 수 있습니다.
LaMDA에 대해 이야기하는 것은 중요합니다. 왜냐하면 많은 사람들이 시스템의 수에 대해 제한된 시각을 가지고 있기 때문입니다. 다음은 몇 가지 예시입니다:
BERT: 구글 AI에 의해 개발된 양방향 인코더 표현 변환(BERT)은 Transformer에서 파생된 모델입니다
- XLNet: 언어 이해를 위한 일반화된 자기 회귀 사전 훈련은 Carnegie Mellon 대학과 Google AI
- XLM-RoBERTa에 의해 개발되었습니다. 페이스북 AI
- Cohere가 개발한 강력하게 최적화된 BERT 사전 훈련 접근 방식: Cohere AI
- GLM-130B에 의해 특정 도메인과 작업에 대해 세밀하게 조정할 수 있는 LLM: Huawei
- Meta LLaMA AI가 개발한 1300억 개의 매개변수를 가진 생성형 LLM: 메타 AI
- 친칠라가 개발한 1.6조 개의 파라미터를 가진 Meta LLM 아키텍처: LG AI Research에 의해 개발된 여러 언어로 자연스러운 텍스트를 생성할 수 있는 대형 언어 모델
- LaMDA: Google Research에서 개발한 대화 응용 프로그램을 위한 언어 모델
- PaLM: DeepMind
이 개발한 문맥 조건부 생성을 위한 자동 인코딩 및 자기회귀 언어 모델을 사전 훈련하는 것은 GPT 3가 인공지능이 엔지니어만을 위한 것이라는 대중의 인식을 깨뜨린 최초의 모델이었습니다. Gpt 3는 세계에 과학 소설이 그렇게 허구가 아니라는 것을 보여준 최초의 언어 모델이었습니다.
GPT-4 및 GPT-3에서의 입력 유형
번역에 관련하여 사용자는 채팅 GPT 3 또는 4 인터페이스에서 텍스트를 입력하고 번역 프롬프트 앞에 위치시킨 후 번역된 텍스트를 받을 수 있습니다. 사용자는 일반 텍스트로 제한됩니다.
모든 서식이 손실되며, 그것을 보존하는 유일한 방법은 BWX와 같은 번역 관리 시스템을 사용하여 파일을 원시적으로 구문 분석하여 GPT 3 및 4와의 정보 교환 시 서식 또는 기타 메타 텍스트 정보의 손실 없이 작업하는 것입니다.
OpenAI 모델의 세부 조정
번역의 출력 품질은 주로 매개변수와 훈련 데이터의 크기에 기반한 언어 모델의 세련도에 따라 결정됩니다. 하지만 이것은 또한 프롬프트의 품질과 사람(인간 사용자)이 제공하는 추가적인 맥락에 기반을 두고 있습니다.
언어 모델이 더 많은 안내를 받을수록, gpt 3 또는 4는 독자에게 의미 있는 단어를 전달할 수 있게 됩니다.
만약 당신의 프롬프트에서 번역이 비공식하고 매력적으로 들리길 원한다고 설명한다면, gpt 3는 해당하는 방식으로 "말"하고 프롬프트와 공감하는 방식으로 응답을 작성하는 자유를 가질 것입니다.
그래서 Bureau Works에서는 기계 학습 엔지니어들이 제로샷 및 퓨샷 학습에서 최고의 성능을 끌어내도록 노력합니다.
기계 학습 유형의 메커니즘과 메시지를 해석하고 사용자에게 의미 있는 방식으로 응답하는 능력에 대해 자세히 설명하지 않고, Bureau Works에서는 기초부터 응답을 구축하는 데 초점을 맞추었습니다.
AI는 사용자의 아이디어와 목적에 맞게 맥락화된 메시지를 작성할 수 있어야 합니다.
예를 들어, 사용자가 번역이 원래의 영어 텍스트와 의미적으로 다르더라도 자연스럽게 들리길 원한다면, AI가 생성한 출력을 읽을 때 인터넷 사용자가 반응해야 하는 방식에 완벽하게 맞을 수 있지만 이상하게 느껴질 수도 있습니다.
BWX는 gpt 3 또는 4와 상호 작용할 수 있는 능력을 가지고 있으며 다음을 고려하는 기타 AI 모델도 지원합니다:
- 번역 메모리에 저장된 이전 번역
- 용어
- 도메인
- 서식/태깅
이러한 세부 조정을 통해 시스템이 데이터를 처리하고 해당 상호 작용의 맥락 내에서 기대에 더 부합하는 답변을 제공할 수 있는 환경을 만들 수 있습니다.
GPT 3 또는 4에 대한 세밀한 조정된 메시지는 모두 다른 차이를 만드는 독특한 개념을 설명하는 단어를 생성합니다. 다음 예를 살펴보세요:
원본 요약:
Bureau Works는 복잡한 번역 및 현지화 관리를 간단하고 예측 가능한 활동으로 변환하는 클라우드 기반 번역 관리 시스템입니다.
이제 Apple Twist와 함께:
Bureau Works는 어떤 번역 및 현지화 프로젝트도 쉽고 자신감 있게 처리할 수 있는 강력한 번역 관리 시스템입니다. 클라우드 기반이므로 언제 어디서든 접근할 수 있습니다.
지금은 커트 본네거트 트위스트와 함께:
Bureau Works는 번역과 지역화에 관심을 가지고 있습니다. 우리는 당신도 그렇게 생각해야 한다고 생각합니다. 메시지를 전 세계적인 관객에게 전달하는 것은 쉽지 않습니다. 하지만 우리는 이제까지보다 더 나은 방법으로 더 빠르게 도와 드릴 수 있습니다.
지금은 Gen Z의 트위스트와 함께:
Bureau Works는 환상적입니다. 온라인에서 당신의 물건을 번역하고 현지화하는 시스템입니다. 웹사이트, 앱, 이메일, 문서 등 어떤 것에든 사용할 수 있습니다. 무료로 시작하거나 당신의 분위기에 맞는 요금제를 선택할 수 있습니다.
gpt 3는 이러한 응답을 통해 동일한 주제에 대해 다양한 방식으로 대화할 수 있습니다. 글쓰기의 본질입니다. 같은 개념은 무수히 다른 방식으로 표현될 수 있으며, 각 방식은 AI에 의해 고안되었는지 여부와 관계없이 다른 인간의 감정을 불러일으킬 수 있습니다.
GPT-4 대. GPT-3 모델의 기능
GPT4는 GPT 3의 자연스러운 진화입니다. GPT 4는 GPT 3보다 약 570배 많은 매개변수를 가지고 있습니다 - 1750억 대 30억. 100조. 이로 인해 다양한 AI 모델을 비교할 때 더 일관된 대화와 적은 오류가 발생합니다. GPT 4는 시각적 입력도 분석할 수 있습니다. 두 모델 모두 번역을 위해 훈련되지 않았지만, 두 모델 모두 단어별로 놀랍도록 자연스러운 텍스트를 작성할 수 있습니다.
GPT-4 대비 맥락 정의 GPT-3 대화
컨텍스트는 텍스트 자체가 아니지만 텍스트를 형성하는 모든 정보를 의미합니다. 의미의 웹에서 컨텍스트는 웹 전체를 지원하는 모든 스레드를 의미하며, 텍스트는 웹의 중심 부분입니다.
인공지능과 일반적인 의미에 관해서는 맥락이 모든 것을 바꿉니다. 만약 나는 예를 들어 위가 아래이고 아래가 위라고 인공지능에게 말한다면, 그것은 예를 들어 맥락으로서 나는 7층에 있고 8층으로 가고 싶다고 말하면, 인공지능은 내게 아래로 가야한다고 설명할 것이다.
인공지능은 이를 말할 것입니다. 왜냐하면 저는 텍스트에 접근하는 방식을 안내하는 맥락을 제공했기 때문입니다. 이것은 맥락의 극단적인 예이지만, gpt 3와 같은 ai 모델과의 번역 대화에서 나는 사용하거나 피해야 할 특정 단어, 공식적이거나 비공식적인 특정 어조와 같은 맥락을 정의할 수 있습니다. 또는 gpt 3이 고려해야 할 텍스트의 전반적인 목표에 대한 정보입니다.
API 설정하기
gpt 3 또는 4를 BWX를 통해 사용할 때, API 설정에 대해 걱정할 필요가 없습니다. BWX는 gpt 3 엔드포인트에 액세스할 수 있는 네이티브 API와 gpt 3 또는 4와 정보를 가장 효과적인 방식으로 교환할 수 있는 독점 프레임워크를 갖고 있습니다.
아름다운 점은 우리의 API가 GPT 3 외에도 LaMDA와 LLaMA와 같은 다른 AI 모델을 활용한다는 것입니다. 우리의 API는 gpt 3과 4의 작성물의 관련성을 최대화하기 위해 기계 학습 모델의 조합을 사용합니다. 사용된 프롬프트에 관계없이.
GPT-3를 사용하고 싶으세요?
GPT 3 또는 4를 BWX와 함께 사용하는 것은 매우 간단합니다. 우리의 웹 통합은 웹 앱의 기본 설정으로 활성화되어 있습니다. 이 기사는 우리의 gpt 3 웹 통합의 기본 개요와 기능만을 탐구하지만, 웹 지원 라이브러리에 대한 자세한 정보는 support.bureauworks.com
에서 찾아볼 수 있습니다. 무료 평가판에 가입하실 수 있으며, 물론 평가 기간이 끝나기 전에 언제든지 취소할 수 있으며, 요금이 청구되지 않습니다.
GPT-3 대. GPT-4 - 주요 요점
GPT 3 대비 GPT 4를 적용한 번역에서 우리는 작문 예시에서 현저한 변화를 알아차릴 수 없었습니다. 각 모델은 관련 대화를 생성할 수 있습니다.
우리는 gpt 3가 작성한 예시로 가득 찬 55 페이지 보고서를 제공하고 있으며, 관심이 있다면 여기에서 다운로드할 수 있습니다. 또한, 각 모델의 성능을 자세히 비교하는 새로운 보고서를 작업 중입니다.
이 연구 미리보기가 제공되는 즉시, 관심이 있으시다면 뉴스레터를 통해 알려드리겠습니다. 각 모델은 몇 가지 샷, 제로 샷 또는 기타 종류의 기계 학습 방법을 통해 훈련되었는지에 관계없이, 때로는 놀랍도록 사람과 비슷한 피드를 생성할 수 있습니다.
OpenAI에 따르면, GPT 4는 특정 시나리오에서 GPT 3보다 현저히 우수한 성능을 보이지만, 글쓰기 측면에서는 수준이 비교적 유사하다고 합니다. 더 자세한 보고서를 발행할 때 각 모델을 비교하는 내용이 추가될 예정입니다.
개발자들이 사용할 수 있는 가장 크고 가장 정교한 언어 모델인 Jurassic-1을 사용하고 싶으세요?
Bing에 따르면, "Jurassic-1은 이스라엘의 AI21 Labs에서 개발한 몇 가지 자기 회귀 자연어 처리(NLP) 모델의 이름입니다.1. Jurassic-1 모델은 매우 다용도로 사용될 수 있으며, 인간과 유사한 텍스트 생성 능력 뿐만 아니라 질문에 대한 답변, 텍스트 분류 등 복잡한 작업을 해결할 수 있는 능력도 갖추고 있습니다23.
Jurassic-1 모델은 두 가지 크기로 제공되며, Jumbo 버전은 1780억 개의 매개변수를 가지고 있어 개발자들이 일반적으로 사용할 수 있는 가장 크고 정교한 언어 모델입니다23.
GPT 4는 Jurassic-1 JUMBO보다 매개변수가 거의 3배 많은 인공지능 모델입니다. Jurassic-1는 gpt 3보다 더 큰 모델이었지만, gpt 4에 의해 앞지러졌습니다. gpt 3보다 크다는 것은 반드시 더 좋은 결과를 내는 것을 의미하지 않았습니다.
결국, 훈련된 GPT 3 모델이 세상에 진정한 웹과 AI 모델의 실제 응용 프로그램을 보여줬습니다. 통합에 관해서는, 현재 상태와 예측에 따르면 BWX는 각 모델이 제공하는 최상의 성과를 추출하기 위해 여러 모델과 통합될 것으로 예상됩니다.
GPT-4 사용 비용 vs. GPT-3
Open AI API 비용에 대한 정보는 다음을 참조하십시오: https://openai.com/pricing
GPT 3와 BWX를 사용하는 데는 차이가 없습니다. GPT 4. 우리의 API는 비용 대비 효과적인 모델을 통해 콘텐츠를 자연스럽게 라우팅합니다.
이 기사는 gpt 3와의 통합이 어떻게 작동하는지에 대한 기술적인 세부 정보를 다루지 않지만, 지원 라이브러리에서 여기에서 찾을 수 있습니다: http://support.bureauworks.com
GPT-4는 현재 GPT-3보다 비용이 더 비싸며, 이 모델은 응답을 생성하기 위해 훨씬 더 많은 컴퓨팅 파워를 사용합니다.
GPT-3.5 Turbo 현재 1K 토큰당 $0.002의 가격이며, 32k GPT 4 프롬프트 모델은 1K 토큰당 $0.06 / $0.12로, 약 30배 더 비싸다.
그러나 번역기용 BWX 계획에는 GPT 통합이 기본 가격의 일부로 포함되어 있으며, 사용자 당 월간 주기당 최대 200,000 단어의 처리가 가능합니다. 가격은 사용자 당 $9부터 시작합니다.
제로샷 번역
지금까지의 연구에 따르면, 제로샷 번역은 일관성과 신뢰성 있는 결과를 내지 못합니다. gpt 3가 사전 훈련된 언어 모델로서 얼마나 놀라운지는 알 수 있지만, 추가적인 문맥 없이 번역을 진행하면 혼합된 결과물이 나옵니다.
우리는 고도로 훈련된 환경이나 퓨-샷 학습에 의해 주도되는 환경에서 더 나은 결과를 찾을 수 있습니다.
제로샷 번역 gpt 3 또는 4는 모두 일관성 없는 결과를 낼 가능성이 있습니다. 이 기사에서 보여준 대로, 그들은 모두 웹 콘텐츠로 훈련받으며 동일한 입력과 프롬프트에 대해 때때로 의도적으로 다른 출력물을 생성할 것입니다.
번역은 브랜드 일관성, SEO, 이해성 및 사용자 수용을 위한 요구 사항을 촉진하기 위해 지식 베이스를 활용하고 구축하는 것입니다.
직접 만들고 싶으세요?
GPT 3와의 통합 구축은 비교적 간단합니다. API는 잘 문서화되어 있으며 엔드포인트는 잘 작동합니다. API 아키텍처 주변의 요청 제한, 텍스트 크기 및 기타 제약 사항에는 도전 과제가 있습니다. 하지만 가장 중요한 것은 GPT 3 또는 4와의 통합을 구축하는 것이 쉬운 부분입니다.
적절한 맥락이 주어진다면 GPT 3 또는 4는 이론적으로 스스로 통합을 생성할 수 있습니다. 도전적인 부분은 통합이 텍스트를 입력하고 텍스트를 출력할 수 있다는 것이지만, 서식의 보존, 용어 일관성의 유지, 이전에 번역된 자료를 참조로 사용하는 것, 사용자 입력으로부터 학습하는 것 및 대규모로 고품질 번역을 생성하는 데 중요한 상황 등에는 명확한 제한이 있을 수 있다는 것입니다. 그래서 너 혼자 할 수 있어? 확실히.
효과적이고 확장 가능한가요? 의심스럽다. GPT 3와 4에서 지금까지 얻은 주요 교훈 중 하나는 그들이 얼마나 강력하고 인간 같이 들리더라도 일관된 최고 성능을 제공하기 위해서는 안내, 구조 및 적절한 요소가 필요하다는 것입니다. 그래서 우리는 BWX를 14일 동안 무료로 시도해보고, GPT와 깊게 연결된 이러한 특별한 통합으로부터 얻을 수 있는 마법을 직접 확인해보시기를 권장합니다. 이는 최소한의 인간 개입으로 대규모의 고품질 번역을 생산하기 위해 처음부터 설계된 환경에서 이루어집니다.