문화

기계 번역(MT)에서 의미론이란 무엇인가요?

시맨틱은 상황에 맞는 번역을 생성하는 데 핵심이며, MT 시스템은 이 분야를 해결하기 위해 AI와 딥 러닝을 통해 개선되고 있습니다.

4 min

의미론은 번역 업계에서 중요한 연구 분야입니다. 간단히 말해서, 의도한 의미를 전달하기 위해 단어와 문장이 어떻게 배열되는지 설명합니다.

MT는 점점 더 문맥에 민감한 번역의 일부가 되고 있기 때문에 시맨틱스도 이 기술 통합에서 중요한 역할을 합니다. 어떻게 해서? 기계 번역의 의미론은 기계 학습을 훈련하고 번역 프로젝트에서 더 나은 결과를 얻기 위한 기초입니다.

의미론이 무엇이며 인공 지능에 의해 어떻게 처리될 수 있는지 요약하는 것으로 시작하겠습니다.

의미 요약

의미론은 단어와 문장의 올바른 조합을 통해 의미를 다루는 언어학의 한 분야입니다.

이 텍스트 요소의 퍼즐을 배열하는 방법에는 여러 가지가 있습니다, 그리고 의미론은 다음과 같이 작업할 수 있는 몇 가지 개념을 제공합니다:

지시적 의미

그것은 객관적으로 문자 그대로의 의미를 나타냅니다. 번역에서 표기에 초점을 맞추면 때때로 지나치게 직역으로 이어질 수 있지만 과학과 같은 보다 전통적인 내용을 다룰 때 유용할 수 있습니다.

예.:

"기후 변화로 인해 바다가 더 빠르게 따뜻해지고 있습니다." (영어)

"해양은 기후 변화로 인해 빠르게 따뜻해지고 있습니다." (스페인어)

이중 의미는 없겠죠? 문장이 모든 언어에 대해 무엇을 긍정하는지는 매우 분명합니다.

함축

함축은 단어가 문자 그대로의 의미를 넘어서는 정서적 또는 문화적 연관성을 포함합니다.

이러한 뉘앙스는 언어마다 크게 다를 수 있으며 특히 문학을 번역할 때, e-러닝, 시 등의 경우 번역에서 신중한 처리가 필요합니다. 많은 산업들이 이 문제에 대해 실수를 합니다.

예: "여우"라는 단어

"여우"라는 단어를 들으면 이 야생 동물이 생각나나요, 아니면 영리한 사람이 생각나나요? 이미지 출처: Scott Walsh on unsplash.com

영어에서 "여우"라는 단어는 문자 그대로 교활한 성격으로 알려진 야생 동물을 나타냅니다. 그러나 은유적으로 사용될 때도 함축적인 의미가 있습니다. 누군가를 "여우"라고 부르는 것은 상황에 따라 다른 의미를 가질 수 있습니다.

긍정적 의미: 그것은 전략적이거나 눈치가 빠른 사람과 같은 영리함 또는 교활함을 암시합니다.
부정적인 의미: 교활하거나, 기만적이거나, 신뢰할 수 없다는 약간 부정적인 의미를 가질 수 있습니다.

하위어와 상위어

Hyponymy는 더 넓은 범주(hypernym)에 속하는 보다 구체적인 용어를 말합니다. Hypernymys는 큰 우산과 같으며 hyponymys는 그 아래의 구체적인 예입니다.

이러한 관계를 이해하면 번역에서 올바른 단어 선택에 도움이 됩니다.

hyponymy의 예: "장미", "튤립", "데이지"는 모두 상위어 "꽃"의 하위어입니다. 번역에서 하의어와 상위어 사이에서 선택하는 것은 문맥에 따라 다릅니다.

예를 들어, "flower"를 프랑스어로 "fleur"로 번역하는 것은 간단합니다. 그러나 "rose"를 번역하려면 "rose"라는 더 구체적인 용어가 필요한데, 그 이유는 언어에도 각각에 대한 특정 단어가 있기 때문입니다.
Hypernymy의 예: 영어 텍스트에는 'flower'이라고 되어 있지만 원본 텍스트에는 장미나 백합과 같은 특정 유형이 언급되어 있는 경우, 프랑스어에서 일반적인 용어 'fleur'를 사용하면 일부 특수성을 잃을 수 있습니다.
다의성

Polysemy는 여러 관련 의미를 가진 단어를 나타냅니다. 번역에서는 문맥에 따라 올바른 의미를 파악하는 것이 필수적입니다.

예:

영어 단어 "bank"은 금융 기관 또는 강변을 의미할 수 있습니다. 프랑스어로 번역하면 금융 기관은 "banque",이고 강둑은 "rive"입니다. 번역가는 문맥에 따라 올바른 용어를 선택해야 합니다.

애매성

모호성은 단어, 구 또는 문장이 두 가지 이상의 방식으로 해석될 수 있을 때 발생합니다. 번역에서 모호성을 처리하려면 의도된 의미를 신중하게 고려해야 합니다.

예:

"매니저는 안경을 쓴 직원을 보았다"는 모호한 문장입니다. 관리자가 안경을 가지고 있습니까, 아니면 직원이 가지고 있습니까? 번역에서 이러한 모호성은 문맥에 따라 해결해야 할 수 있습니다.

예를 들어, 스페인어로 문자 그대로 번역할 때 모호함은 여전히 존재합니다. "매니저가 안경을 쓴 직원을 보았다". 어느 쪽이 안경을 쓰고 있습니까?

기계 번역에서 의미론이 왜 중요한가요?

의미론은 기계가 인간의 언어를 이해하고 처리하는 방식에 존재합니다. 모든 콘텐츠의 올바른 의미를 파악할 수 있도록 AI를 훈련시키는 핵심입니다.

잘못된 기계 학습 프로세스를 사용하는 CAT 도구를 사용할 경우, 앞서 언급한 모든 종류의 의미 문제(해결해야 할 문제로서)가 발생할 수 있습니다: 모호성, 다의성, 내포/표기의 혼동된 사용 등.

올바른 출력을 얻는 것은 기계가 컨텍스트를 인식하는 능력에 달려 있습니다.

관용적 표현은 훨씬 더 민감하며, 대부분의 경우 두 언어의 문화적 뉘앙스를 이해하는 인간 번역가의 조정이 필요합니다.
예를 들어, "break a leg"라는 문구를 문자 그대로 다른 언어로 번역하면 혼란스러운 메시지가 될 수 있습니다. 영어로, 그것은 누군가에게 행운을 빌어주는 방법입니다. 하지만 우리가 브라질 포르투갈어로 번역하면 문자 그대로 "많은 쓰레기"를 의미하는 "muita merda!"를 사용할 수 있지만, 올바른 의미로 브라질 연극계에서 행운을 비는 매우 인기 있는 표현이기도 합니다.