기술

인공지능이 전체 기계 번역 산업을 어떻게 변화시키고 있는가

기계 번역은 많은 사람들이 존재는 알지만 그것이 무엇인지 이해하지 못하는 주제입니다. 네, 우리는 그것이 자동 번역이라는 것을 알고 있지만, 어떻게 작동하는지 이해하고 있나요?
Rodrigo Demetrio
2분
목차

기계 번역은 많은 사람들이 존재는 알지만 그것이 무엇인지 이해하지 못하는 주제입니다. 네, 우리는 그것이 자동 번역이라는 것을 알고 있지만, 어떻게 작동하는지 이해하고 있나요? 소프트웨어에 의해 번역된 텍스트를 가리키는 용어는 주로 계산 언어학에서 사용됩니다.

자동화된 도구인 기계 번역은 번역 분야 전체를 변화시킬 잠재력을 가지고 있습니다. 기술적인 성격 때문에 수백만 개의 문서 번역 비용을 크게 줄일 수 있습니다. 이는 결과적으로 기업들이 국제적으로 성장하는 데 도움이 될 것이며, 세계화를 촉진할 것입니다. 하지만 미래는 훨씬 더 빠르고 효율적인 자동 번역 방법을 가리키고 있습니다: 인공지능을 사용하는 것입니다. 이것이 관련된 모든 것을 알아야 할 필요가 있습니다!

기계 번역의 시작

기계 번역(Machine Translation 또는 MT로도 알려짐)은 1629년까지 거슬러 올라갈 수 있다. 이것은 프랑스 철학자 르네 데카르트가 보편적인 언어에 대해 대화를 시작한 해입니다. 심볼과 논리의 원리를 사용하여 데카르트는 새로운 형태의 커뮤니케이션을 제안했습니다.

보편적인 언어는 한 개의 심볼을 통해 다른 언어에서 동등한 아이디어를 전달할 수 있을 것입니다. 원래 데카르트와 독일 수학자인 고트프리드 빌헬름 라이프니츠는 숫자에 대해 생각하고 있었습니다. 그러나 시간이 지남에 따라, 보편적인 언어의 개념이 기계 번역에 적용되기 시작했습니다.원래로는 데카르트와 독일 수학자인 고트프리드 빌헬름 라이프니츠 모두 숫자에 대해 생각하고 있었습니다. 그러나 시간이 지나면서 범용 언어의 개념이 기계 번역에 적용되기 시작했습니다. 50년대 이후로 수학적인 텍스트를 다른 언어로 번역하기 위해 많은 연구가 진행되었습니다. 결국 이것이 현대 기계 번역의 형태로 이어졌습니다. 결국, 이것은 현대형 기계 번역의 형태로 이어졌습니다. 기계 번역의 3가지 주요 접근 방식은 다음과 같습니다:

  • 규칙 기반 기계 번역 (1950 - 1980)
  • 통계 기계 번역 (1990 - 2015)
  • 신경망 기계 번역 (2015 - 현재)

규칙 기반 기계 번역

규칙 기반 기계 번역은 70년대부터 개발되기 시작했습니다. 이 접근법은 MT의 "고전적 접근법"으로도 알려져 있으며 언어학적 규칙에 크게 의존합니다. 따라서 각 언어 쌍에 대해 다양한 양방향 사전을 사용합니다. '기계 번역'은 서로 다른 언어의 규칙을 매핑하는 데 초점을 맞춘 규칙 기반 기계 번역입니다.

통계 기반 기계 번역

통계 기반 기계 번역은 규칙 기반 기계 번역보다 거의 10년 후에 연구되기 시작했으며 통계 모델의 매개 변수에 기반합니다. 이러한 모델은 양방향 텍스트 집합의 분석을 통해 개발됩니다. 규칙 기반 서버와 달리, 통계 기반 기계 번역은 패턴 인식을 만들고 필요로 합니다. 따라서 의도한 대로 작동하려면 막대한 언어 말뭉치가 필요합니다.

신경망

신경망 기계 번역(NMT)은 인공지능과 딥러닝을 사용하여 더 정확한 번역을 달성합니다. 인공 신경망은 대량의 데이터를 처리하여 패턴을 인식하는 방법을 학습합니다.

이러한 네트워크는 입력 그룹에 비선형 함수를 적용하는 학습 알고리즘입니다. 이 작업은 다음 레이어에 대한 자원으로 사용될 출력을 생성합니다. 신경망에는 가중치/매개변수와 연결된 여러 레이어가 있습니다. 이러한 모든 레이어는 가능한 조합을 증가시키는 비선형 특징을 가진 입력을 받습니다.

따라서 인코더 신경망은 원본 언어의 문장을 처리하여 벡터 표현으로 변환하고, 이를 디코더 신경망에서 사용하여 대상 언어의 문장을 예측합니다. NMT는 다양한 데이터 소스에서 학습하고 다른 맥락에 적응할 수 있으며, 모델은 원하는 데이터베이스로 쉽게 조정하고 업데이트할 수 있습니다.

훈련 단계는 몇 주가 걸리지만, 시스템은 자동으로 매개변수를 수정할 수 있습니다. 출력이 생성되고 기대하는 참조와 비교되면, 기계에 피드백을 보내어 레이어와 연결의 가중치를 조정할 수 있습니다.

통계 기계 번역 대 신경망 기계 번역

통계 기계 번역 시스템에 가설을 생성할 수 있도록 기존 번역이 필요합니다.입력으로 작동할 이중 언어 텍스트 코퍼스를 수집하면, SMT 결과는 이전 번역의 품질에 따라 다를 수 있습니다.

흔하지 않은 언어의 경우, 좋은 번역을 얻기 위해 충분한 이중 언어 자료를 제공하기 어려울 수 있습니다. 관용구, 새로운 속어와 표현, 신조어, 언어적 장난 및 문학적 창작 텍스트의 다른 구성 요소는 SMT에 문제가 될 수 있습니다. 이러한 언어 사용이 훈련에 사용된 말뭉치에 없는 경우입니다.

원본 언어의 어순이 목표 언어와 매우 다른 경우에도 결과가 덜 정확할 수 있습니다. 또 다른 단점은 시스템을 구현한 후 버그를 수정하기가 더 어렵다는 것입니다. 다시 시작하고 데이터 입력에서 다른 작은 실수를 확인해야하기 때문입니다.

출처:  SyncedReview

인공지능으로 구동되는 기계 번역

규칙 기반, 통계 기반 및 신경망 기반 접근 방식은 각각 장단점이 있지만, 기계 번역의 다음 단계를 열어놓은 것은 부인할 수 없습니다.

무엇에 대해 이야기하는지 모르는 경우, 한 가지 팁을 드리자면, 그것은 기술과 깊은 관련이 있다는 것입니다. 다음 세대 기계 번역은 인공지능과 딥 러닝에 의존할 것입니다. 그리고 이것은 훌륭한 소식입니다!인공지능과 딥 러닝은 기계 번역을 변혁시킬 잠재력이 있으며, 단어와 용어의 의미에 대한 맥락화된 결정을 내릴 수 있게 될 것입니다. AI는 또한 언어 쌍 간의 패턴을 더 잘 인식할 수 있게 만들어줄 것입니다. 번역 과정 전체는 번역자에게만 의존하지 않을 것입니다 - 그들은 역할을 전환하여 결과물의 검토자와 테스터가 될 것입니다. 인공지능은 또한 기계 번역이 언어 쌍 간의 패턴을 더 잘 인식할 수 있게 만들어줄 것입니다. 전체 번역 과정은 번역자에게만 의존하지 않을 것입니다 - 그들은 역할을 전환하여 결과물의 검토자 및 테스터가 될 것입니다. 이로 인해 번역된 문서가 더 빠르고 저렴하게 제공되며, 결국은 더 나은 결과를 제공하고 서로 다른 언어를 사용하는 사람들 간의 커뮤니케이션을 용이하게 할 것입니다. 우리는 이전보다 3, 4 또는 5배 더 많은 단어를 번역하는 속도를 최적화할 수 있습니다 - 가능성은 무한합니다! 우리는 이전보다 3,4, 또는 5배 더 많은 단어를 번역할 수 있는 속도를 최적화할 수 있습니다 - 가능성은 무한합니다! 이 의미에서, 번역된 콘텐츠의 품질을 측정할 수 있는 새로운 방법을 배우는 것도 중요합니다.

이를 위한 최고의 방법 중 하나는 BLEU 점수를 사용하는 것입니다. 이 알고리즘은 자동 번역된 텍스트의 품질을 측정할 수 있는 능력을 가지고 있습니다. 이 의미에서 번역된 콘텐츠의 품질을 측정할 수 있는 새로운 방법을 배우는 것도 중요합니다. 그러한 방법 중 하나는 자동 번역된 텍스트의 품질을 측정할 수 있는 BLEU 점수라는 알고리즘을 사용하는 것입니다. 인공지능과 딥러닝에 의해 이끌리는 기계 번역은 수천 개의 기업이 글로벌 시장을 고려할 수 있게 만들어줄 것입니다. 이는 국제 기구들이 시장에 머무르고 다른 시장에 진출하는 데도 도움이 될 것입니다. 또한 국제 기관들이 시장에 머무르고 다른 시장에 진출하는 데 도움이 될 것입니다. 비용이 크게 낮아질 것이므로, 기업들은 어떤 언어를 우선시할지에 대해 비용 기반의 결정을 내릴 필요가 없을 것입니다.

회사들은 로컬화된 형태로 어디에서나 이용 가능할 것입니다. 정말 멋지게 들리지 않나요? 그리고 실제로 그렇습니다! 그러나, 우리가 미래에 대해 이야기하고 있다는 것을 주목하는 것이 중요합니다.  우리가 번역을 위해 AI에만 의존할 수 있는 지점에 도달하기까지는 아직 멀었습니다. 다른 초기 접근 방식과 마찬가지로, 이 새로운 기술을 완전히 개발하는 데 몇 년이 걸릴 것으로 예상됩니다. 그리고 기술을 완전히 흡수하는 데는 더 많은 시간이 걸릴 것입니다.

번역가의 미래

물론, 이 과정에서도 몇 가지 도전이 있을 것입니다. 예를 들어, 번역가의 역할은 거의 완전히 재정의되어 오래되지 않도록 해야 합니다. 하지만, 이는 이러한 전문가들이 자신을 재창조할 수 있는 큰 기회를 뜻합니다.

우리는 이것을 극복해야 할 도전으로 보아야 합니다 - 문제로 보면 안 됩니다. 그렇게 하면 인공지능과 딥러닝이 기계 번역에 가져다줄 수 있는 긍정적인 측면을 즐길 수 있을 것입니다. 새로움에 열려 있고, 배우고, 적응함으로써, 우리는 기계 번역을 사회적이고 경제적인 변화로 바꿀 수 있으며, 우리가 직면한 도전을 정복할 수 있는 더욱 인식력이 높고 잘 준비된 사람들로 다시 등장할 수 있습니다.

우리의 번역 관리 시스템으로 Glocalization 의 힘을 활용하세요.

우리의 번역 관리 시스템으로

의 힘을 활용하세요.

시작하기
Rodrigo Demetrio
Passionate about bringing ideas to life and how languages connect people. One dream? Less marketing, more conversations, less algorithm content, and more originality. Let’s make something awesome together!
흠잡을 데 없이 두 배 빠른 번역
시작하기
온라인 이벤트!
웨비나

14일 간 무료로 Bureau Works 이용

ChatGPT 통합
지금 시작하기
첫 14일은 무료
기본 지원도 무료 제공