文化

什么是机器翻译(MT)中的语义?

语义是生成上下文敏感翻译的关键,MT系统通过AI和深度学习在这一领域不断改进。
Thalita Lima
4 min
Table of Contents

语义学是翻译行业的一个重要研究领域。 简单来说,它解释了单词和句子是如何排列的,以表达你想要传达的含义。

由于 MT 越来越多地成为上下文相关翻译的一部分,语义在这种技术集成中也发挥着作用。 怎么会这样呢?机器翻译中的语义是训练机器学习和在翻译项目中取得更好结果的基础。 

让我们首先总结一下什么是语义,以及它如何被人工智能处理。

语义总结

语义学是语言学的一个分支,通过正确使用单词和句子的组合来处理意义。

有很多方法来安排这个文本元素的拼图,语义为我们提供了一些可以使用的概念,例如:

  • 含义

它客观地是指字面意义。 在翻译中,专注于指称有时可能导致过于字面化的翻译,但如果处理更传统的内容,例如science,这可能是有用的。

例如:

“由于气候变化,海洋变暖得更快”。 (英文)

“由于气候变化,海洋正在迅速变暖。” (Spanish)

没有双重含义,正确吗?很明显,这些句子对任何语言的确认都是如此。

  • 内涵

内涵涉及一个词超出其字面含义的情感或文化联系。 

这些细微差别可能因语言而异,在翻译时需要小心处理,特别是如果你正在翻译文学、在线学习、诗歌等。 许多行业在这个问题上犯错误。

例如:“狐狸”这个词

__wf_reserved_inherit
“狐狸”这个词会让你想起这只野生动物,还是让你想起一个聪明的人?图片由 Scott Walsh 在 unsplash.com

在英语中,“fox”这个词的字面意思是一种以其狡猾的天性而闻名的野生动物。 然而,当以比喻的方式使用时,它也有内涵。 称某人为“狐狸”可能具有不同的含义,具体取决于上下文:

  • 积极含义: 它意味着聪明或狡猾,就像一个有策略或机智的人。
  • 负面含义: 可能具有狡猾、欺骗或不值得信赖的轻微负面含义。
  • Hyponymy 和 Hypernymy

Hyponymy 是指在更广泛类别(hypernym)下的更具体的术语。 上位词就像一把大伞,而下位词是伞下的具体例子。

理解这些关系有助于在翻译中选择正确的词语

  • Hyponymy 示例: “玫瑰”、“郁金香”和“雏菊”都是上位词“花”的下位词。 在翻译中,在下位词和上位词之间进行选择取决于上下文。 例如,将 “flower” 翻译成法语为 “fleur” 很简单。 但是翻译“rose”需要使用更具体的术语“rose”,因为该语言也有针对每个术语的特定词。

  • Hypernymy 示例: 如果英文文本说'flower'但源文本提到了特定类型,如玫瑰或百合,那么在法语中使用通用术语'fleur'可能会失去一些特异性。

  • Polysemy

Polysemy 是指具有多种相关含义的词。 在翻译中,根据上下文确定正确的含义是必不可少的。

例如:

英文单词 “bank” 可以表示金融机构或河边。 如果翻译成法语,金融机构是 “banque”,而河岸是 “rive”。 译者必须根据上下文选择正确的术语。

  • 歧义

当一个单词、短语或句子可以用多种方式解释时,就会出现歧义。 处理翻译中的歧义需要仔细考虑预期的含义。

例如:

“经理看到了戴眼镜的员工” 是一个模棱两可的句子。 经理戴眼镜还是员工戴眼镜?在翻译中,这种歧义可能需要根据上下文来解决。 

例如,当按字面意思翻译成西班牙语时,歧义仍然存在: “经理看到了戴眼镜的员工”. 哪一个在用眼镜?

为什么语义在机器翻译中很重要?

语义存在于机器理解和处理人类语言的方式中。 这是训练AI能够获得任何内容的正确意义的关键点。

如果您使用具有糟糕机器学习过程的CAT工具,我们之前提到的各种语义问题可能会出现(作为您需要解决的问题):歧义、多义词、混淆的内涵/外延使用等。

获得正确的输出将取决于机器识别上下文的能力。 

习语更为微妙,在大多数情况下,您将需要了解两种语言文化细微差别的人类译者进行调整。
例如,将短语 “break a leg” 字面翻译成另一种语言可能会导致令人困惑的消息。 在英语中,这是祝某人好运的一种方式。 但是如果我们将其翻译成巴西葡萄牙语,你可以使用“muita merda!”,字面意思是“很多废话”,但在正确的语境下,这也是巴西戏剧界中一个非常流行的表达方式,用来祝好运。

__wf_reserved_inherit
图片由 Dayne Topkin 在 unsplahsh.com

理解语义含义可以让 MT 系统产生更准确和有意义的翻译。

他们的算法利用语义分析技术从文本中提取含义,包括处理情感分析、语言翻译和问答。 

MT语义挑战

您可以想象,在 MT 系统中输入语义是具有挑战性的。 每种语言都有数百种文化背景、习语和俚语,这使得可以理解为什么机器有时会挣扎。

尝试在 Deep L 或 Google 翻译中将表达式 Let the CAT out of the bag!” (意思是 无意中泄露秘密”)翻译成另一种语言。 结果可能会因为如此直白而很有趣!

__wf_reserved_inherit
图片由 Ani Adigyozalyan 在 unsplahs.com

虽然 MT 系统已经通过 AI 和深度学习得到了改进,但完善语义仍然是一项正在进行的工作。

在技术和机器翻译中,掌握语义是生成准确、上下文感知翻译的关键。 尽管机器翻译工具已经取得了长足的进步,改进机器理解和应用语义的方式对于语言技术的未来至关重要。

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Thalita Lima
photography | writing | communication for socio-environmental impact | art
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support