如果您曾经尝试过用不会说的语言进行交流,您就会知道这是多么令人沮丧,有时甚至是有趣的。 你做了个手势,说同样的话慢了些(好像这有帮助),你希望对方能理解你的意思。
实时 AI 翻译技术有望让这些时刻成为过去。 这个想法很简单:你说了什么,设备或应用程序会立即将其翻译成另一种语言。 这听起来像是解决语言障碍的终极方法,在某些情况下,它实际上是。
但它的效果是否像我们希望的那样好?这要看情况。
这些工具的正确之处
不可否认,实时AI翻译可以是救命稻草。
想象一下:你在一个不会说当地语言的城市。 您需要查找最近的火车站,但所有的标志都无法阅读。 你掏出手机,说:“火车站在哪里?”突然间,与你交谈的人完全明白你的意思。
或者,也许您正在与来自三个不同国家的人进行视频通话,并且每个人都在说自己的语言。 与其感到完全迷失,不如使用一个正在运行的翻译工具,让您能够跟上对话。
这些工具非常适合像这样的简单实用情况。 他们让世界感觉更容易接近。
事情变得复杂的地方
这里有一个棘手的部分:语言不仅仅是文字。 它关乎文化、语气和意义。
这就是实时 AI 翻译开始遇到问题的地方。
想想俚语。 如果有人说,“这很酷”,他们可能是说它很好,而不是真的很冷。
但是翻译应用程序可能无法理解差异,突然间,您得到的回复毫无意义。
或者以幽默为例。 笑话通常依赖于文化背景、文字游戏或时机。 AI 不理解这些。 试着翻译像“为什么鸡要过马路?”这样简单的东西,你就会发现事情分崩离析的速度有多快。
然后是语气。 如果有人说,“没事”,他们是高兴、恼火还是只是无动于衷?有时用你自己的语言很难分辨,对于 AI 来说更难。

实时翻译的下一步是什么?
好消息是这些工具正在改进。
开发人员正在研究不仅仅翻译单词而是试图理解其背后上下文的系统。
他们正在教授 AI 翻译来处理口音、嘈杂的环境,甚至是没有直接翻译的短语。
这是一条漫长的道路,但进展令人鼓舞。 随着时间的推移,实时 AI 翻译可能会成为一种真正自然的感觉,而不仅仅是功能性的。
重要性
实时翻译的核心不仅仅是让旅行更轻松或会议更顺畅。 这是为了帮助人们建立联系。 这是关于让某人用自己的语言表达自己,并且仍然被理解。
我们今天拥有的工具并不完美,它们可能永远无法取代人工翻译带来的细微差别。
但它们是朝着正确方向迈出的一步。即使他们达不到要求,我们正在构建技术来弥合这些差距的事实也说明了一些重要的事情:我们希望更好地了解彼此。

研究
在当今这个疯狂发展的世界中,至少在技术方面,翻译和口译是这种运动的一部分。
众所周知,AI 可以每天翻译得更好、更快。 这适用于实时翻译。
实时 AI 翻译是通过语音识别、神经机器翻译(NMT)和深度学习的组合资源实现的。
这些是使 AI 能够编写或说该语言、掌握上下文并在几秒钟内生成精确翻译的特定技术。
这里有三个强大的AI翻译工具,展示了实时翻译的实际相关性和实际应用。
1. Google Translate

实用用途
Google Translate 是当今最知名和广泛使用的翻译工具之一,其口译模式通过每次使用将实时AI 翻译提升到新的、更令人兴奋的水平。
此工具和特定模式可在智能手机和 Google Nest 设备上使用。
看似“神奇”的口译模式允许说不同语言的两个人不间断地保持连贯的实时对话。
现实生活中的例子
让我们想象一下你在东京,需要路线才能到达目的地,但遗憾的是你根本不会说日语。
您设法打开谷歌翻译,然后激活口译模式并冷静轻松地说英语。尽管看起来令人难以置信,但该应用程序可以立即翻译并用日语传递(说出)您的信息。
当当地公民回复您的路线查询时,他们的回答会迅速翻译回英文供您理解。
非常方便、快速且毫不费力。
它是如何实现此功能的?
碰巧的是,谷歌翻译使用神经机器翻译(NMT)和自动语音识别(ASR)来实时处理和解释多种语言的口语。
该模式接受来自数百万次翻译(交互)的持续训练,以提高其准确性。
请注意,虽然它并不完美,但它对于现实世界中的旅行、客户服务和快速对话目标非常有用,在最重要的时候不会有任何延迟。
使用 Google Translate 进行实时翻译(智能手机) (*)

2. Microsoft Translator

实际应用
Microsoft Translator 最初是为商业和专业环境/场景设计的。
这使其成为会议、会议和多语言协作的完美选择。
它能够在人们说话时提供不同语言的实时字幕和字幕(令人瞠目结舌,这是理所当然的)。
现实生活中的例子
一家国际公司正在举办一个虚拟会议,参与的团队来自意大利、日本和瑞典。
当每个人都用他们的母语说话时,Microsoft Translator 会为每个参与者的母语或首选语言生成并提供实时字幕。
这使用户能够彼此保持无缝通信,而无需人工翻译或口译。
因此,减少了人工工作带来的错误余地。
它是如何实现此功能的?
Microsoft Translator 设法集成语音转文本 AI、深度学习模型和基于云的计算。
这种组合正是提供快速且上下文感知翻译/解释的正确公式。 它还能够支持多语言对话,最多可容纳100名参与者,这使其成为全球商业活动中最强大的工具之一。
使用 Microsoft 进行实时翻译(智能手机)

3. DeepL Translate

实际应用
诚然,DeepL 仍然没有包含实时语音翻译功能,以使其在商务和正式互动实时文本翻译方面与竞争对手区分开来。
尽管如此,凭借其人工智能翻译驱动的系统,DeepL带来了自然发音和上下文感知的翻译,在处理精度方面,DeepL经常超越竞争对手。
现实生活中的理论示例
芬兰的一位公司律师正在给智利的一位新客户发送电子邮件。
他们没有选择传统的基本翻译软件,而是决定与 DeepL 合作。
该工具能够在打字时建议实时 AI 翻译;没有一秒钟的信息缺失。 结果是一条经过充分验证且听起来很专业的信息,听起来像智利政党写的西班牙语一样流利。
DeepL 利用深度神经网络深入分析完整的句子和短语,而不是专注于逐字处理。 这有助于它比传统的机器翻译系统更有效地捕捉细微差别、风格、语气和深刻含义。
使用 DeepL (智能手机) 进行实时翻译

评审团已做出裁决: 实时 AI 翻译将继续存在
AI 驱动的翻译不再是我们的想象或单纯的想法。
它已经完全融入了我们的日常生活。
从日常旅行交流到高风险的商业谈判和高度专业的会议,AI翻译工具已经永久模糊了语言的边界。
为什么AI翻译如此完美无瑕
- 语音识别和自然语言处理(NLP): AI 比以往任何时候都更能理解源文本的含义,然后在翻译之前将语音转换为文本。
- 神经机器翻译(NMT): 与传统的逐字翻译完全不同,NMT 会考虑上下文和含义,以便产生更自然的翻译。
- 持续学习: AI 模型在接受输入后,每天都在变得更好,然后分析数百万个真实世界的翻译组合。
但即使是 AI 翻译也不是绝对完美的。 确实,它每天都在变得越来越更智能、更快、更准确。 我们越信任它并使用它,它就会变得越好。
(*)所有实时翻译测试均在 Motorola g54 5 g 设备中进行,耗时约 4 秒。