机器翻译是一个许多人都知道存在但不了解它是什么的主题。 是的,我们知道这是自动翻译,但您了解它是如何工作的吗?该术语用于指定由软件翻译的文本,主要用于计算机语言学。
作为一种自动化工具,机器翻译有可能改变整个翻译领域。 这是因为,由于其技术性质,它可以显著降低数百万份文档的翻译成本。 反过来,这将帮助公司实现国际发展,促进全球化。为此,科学家们已经使用了许多方法,例如基于规则的服务器和统计服务器。 然而,未来指向一种更快、更高效的自动翻译方式:使用 人工智能。 以下是您需要了解的有关此事的所有信息!
机器翻译是如何开始的
机器翻译,也称为 MT,可以追溯到 1629 年。 这一年,法国哲学家勒内·笛卡尔开始了一场关于通用语言的对话。 通过使用符号和逻辑的原理,笛卡尔提出了一种新的交流形式。
这种通用语言将能够通过一个符号以不同的语言传达相同的思想。 最初,笛卡尔和德国数学家戈特弗里德·威廉·莱布尼茨都在思考数字。 然而,随着时间的推移,通用语言的概念开始应用于机器翻译。
自 50 年代以来,已经进行了大量研究将数学文本翻译成不同的语言。 最终,这导致了现代形式的机器翻译。 机器翻译的三种主要方法是:
- 基于规则的机器翻译(1950 - 1980)
- 统计机器翻译(1990 - 2015)
- 神经机器翻译(2015 年至今)
基于规则的机器翻译
基于规则的机器翻译于 70 年代首次开始开发。 这种方法也被称为机器翻译的“经典方法”,并且高度依赖于语言规则。 因此,它为每个语言对使用大量的双语词典。 基于规则的机器翻译侧重于绘制不同语言的规则。

基于统计的机器翻译
基于统计的机器翻译在基于规则的机器翻译之后近十年开始被研究,并且基于统计模型的参数。 这些是通过分析一组双语文本开发的。 与基于规则的服务器不同,基于统计的机器翻译旨在创建模式识别并需要。 因此,它需要一个庞大的语言语料库才能按预期运行。

神经机器
神经机器翻译(NMT)使用AI和深度学习来实现更精确的翻译。 人工神经网络通过处理大量数据来学习识别模式。
这些网络是学习算法,将非线性函数应用于形成层的一组输入。 该操作会生成输出,这些输出将用作下一层的资源。 神经网络中涉及多个层,与权重/参数相连。 所有这些层都接收具有非线性特征的输入,这些特征增加了可能的组合。
因此,编码器神经网络处理源语言中的句子,并将其转换为向量表示,以便在解码器神经网络中使用,以预测目标语言中的句子。NMT 可以从多个数据源中学习并适应不同的环境,因为该模型很容易调整和使用任何所需的数据库进行更新。
训练阶段需要几周时间,但系统可以自动更正其参数。 生成输出并与预期参考进行比较后,您可以向机器发送反馈,它将调整各层和连接的权重。
统计与神经机器
统计机器翻译系统需要现有的翻译来动态生成假设。当您收集双语文本语料库作为输入时,SMT 结果可能会根据这些先前翻译的质量而有所不同。
对于不太常见的语言,可能很难提供足够的双语材料来获得良好的翻译。如果用于训练系统的语料库中不存在这些语言用法,那么这些语言使用对于文学和创意文本来说也可能是一个问题。
当源语言的词序与目标语言的词序差异很大时,结果也可能不太精确。另一个缺点是,一旦系统实施,就更难修复错误,因为您需要重新启动它并检查数据引入中的其他小错误。

来源: 由人工智能提供支持的 SyncedReview
MT
尽管基于规则、统计和神经的方法各有利弊,但不可否认的是,它们为机器翻译的下一步铺平了道路。
如果您不知道我们在说什么,这里有一个提示:它与技术密切相关。 下一代 MT 将依赖于人工智能和深度学习。 这是个好消息! AI 和深度学习有可能改变 MT 并将其提升到一个全新的水平,因为它将能够就单词和术语的含义做出情境化决策。 AI 还将使 MT 能够更好地识别语言对之间的模式。 整个翻译过程将不仅仅依赖于翻译人员——他们将转换角色,成为输出的审校员和测试员。
这将产生更快、更便宜的翻译文档,最终将提供更好的结果并促进说不同语言的人之间的交流。 我们可以将单词的翻译速度优化为比以前快 3、4 或 5 倍 - 天空是无限的!从这个意义上讲,学习我们可以衡量翻译内容质量的新方法也很重要。
最好的方法之一是使用 BLEU 分数,这是一种能够衡量自动翻译文本质量的算法。 由 AI 和深度学习驱动的 MT 将使成千上万的企业能够考虑走向全球。 它还将帮助国际组织留在市场中,甚至进入其他市场。 由于成本会大大降低,公司在讨论优先考虑哪些语言时不必做出基于成本的决策。
公司将以本地化的方式在任何地方提供。 看起来很棒,正确吗?确实如此!尽管如此,重要的是要注意我们正在谈论未来。 我们还有很长的路要走,才能达到可以只依赖 AI 进行翻译的地步。 与任何其他初期方法一样,可能需要几年时间才能完全开发这项新技术,而完全吸收这项技术可能需要更多时间。
译者的未来
当然,一路上也有一些挑战。 例如,翻译的角色必须几乎完全重新定义,以免过时。 然而,这也为这些专业人士提供了重塑自我的绝佳机会。
我们必须将此视为需要克服的挑战,而不是问题。 这样,我们将能够享受人工智能和深度学习可以为机器翻译带来的积极方面。 通过对新事物持开放态度、学习和适应,我们可以将 MT 转变为一场深刻的社会和经济转型,并在另一边重新出现,成为更有意识、能力更强的人,能够克服我们面临的挑战。