話せない言語でコミュニケーションを取ろうとしたことがある人なら、それがどれほどイライラするか、時には笑えるかをご存知でしょう。 身振り手振りをし、同じことをゆっくりと言い(それが助けになるかのように)、相手が自分の言いたいことを理解してくれることを願います。
リアルタイムのAI翻訳技術は、そのような瞬間を過去のものにすることを約束します。 アイデアはシンプルです: あなたが何かを言うと、デバイスやアプリがそれを瞬時に別の言語に翻訳します。 これは言語の壁に対する究極の解決策のように聞こえますが、場合によっては実際にそうです。
しかし、それは私たちが信じたいほどうまく機能しているのでしょうか? それは場合によります。
これらのツールが正しいとする点
リアルタイムAI翻訳が命を救うことがあるのは否定できません。
想像してみてください: あなたは言葉が通じない都市にいます。 最寄りの電車の駅を見つける必要がありますが、すべての標識が読めません。 携帯電話を取り出して「駅はどこですか?」と尋ねると、突然、話している相手はあなたが何を言っているのかを正確に理解します。
あるいは、3つの異なる国の人々とビデオ通話をしていて、全員がそれぞれの言語を話しているかもしれません。 完全に途方に暮れるのではなく、会話についていくことができる翻訳ツールが稼働しています。
このツールは、このようなシンプルで実用的な状況に最適です。 彼らは世界を少し身近に感じさせます。
物事が複雑になる場所
ここが厄介な部分です。言語は言葉だけではありません。 それは文化、トーン、そして意味についてです。
そして、そこでリアルタイムAI翻訳が問題にぶつかり始めます。
スラングについて考えてみてください。 「それはいいね」と言う場合、文字通り冷たいという意味ではなく、良いという意味でしょう。
しかし、翻訳アプリでは違いがわからず、突然、意味のない回答が返される可能性があります。
あるいは、ユーモアを取り入れてみてはいかがでしょうか。 ジョークは、文化的な文脈、言葉遊び、タイミングに左右されることがよくあります。 AIはそれを全く理解していません。 「なぜニワトリは道を渡ったのか」というような簡単なことを翻訳してみると、物事がいかに早くバラバラになるかがわかります。
そして、トーンがあります。 誰かが「それでいい」と言ったら、彼らは幸せなのか、イライラしているのか、それともただ無関心なのか。 時には母国語で伝えるのも難しいことがありますが、AIにとってはさらに難しいことです。

リアルタイム翻訳の次のステップは何か
良いニュースは、これらのツールが改善していることです。
開発者は、単語を翻訳するだけでなく、その背後にある文脈を理解しようとするシステムに取り組んでいます。
彼らは、アクセント、騒がしい環境、さらには直接翻訳されていないフレーズを処理するようにAI翻訳を教えています。
長い道のりですが、その進歩は心強いものです。 時間が経つにつれて、リアルタイムのAI翻訳は、単に機能的であるだけでなく、真に自然に感じられるものになる可能性があります。
なぜ重要なのか
リアルタイム翻訳の本質は、単に移動を容易にしたり、会議を円滑にしたりすることだけではありません。 それは、人々がつながるのを助けることです。 それは、誰かが自分の言語で自分自身を表現し、それでも理解されるようにすることです。
今日私たちが持っているツールは完璧ではなく、人間の通訳者がもたらす微妙なニュアンスを置き換えることは決してないかもしれません。
しかし、それらは正しい方向への一歩です。
そして、たとえそれが不十分であっても、私たちがこれらのギャップを埋めるためのテクノロジーを構築しているという事実は、私たちがお互いをよりよく理解したいという重要なことを示しています。

Research
今日のめちゃくちゃ前進する世界では、少なくとも技術的には、翻訳と解釈はそのような動きの一部です。
AIが日を追うごとにより良く、より速く翻訳できることは周知の事実です。 これは、リアルタイム翻訳に適用されます。
リアルタイムAI 翻訳は、音声認識、ニューラル機械翻訳(NMT)、およびディープラーニングの組み合わせたリソースを通じて実現されます。
これらは、AIが言語を書いたり話したり、文脈を把握したり、数秒で正確な翻訳を生成したりすることを可能にする特定のテクノロジーです。
こちらに示すのは、実際の関連性と実用的な応用を示す3つのパワフルなAI翻訳ツールです。
1. Google Translate

実用的な使用
Google Translateは、今日最もよく知られ、広く普及している翻訳ツールの1つであり、その通訳モードは、リアルタイムのAI翻訳を使用するたびに新しく、よりエキサイティングなレベルに引き上げます。
このツールと特定のモードは、スマートフォンとGoogle Nestデバイスで利用できます。
一見「魔法の」インタプリタモードにより、異なる言語を話す2人が途切れることなく一貫したライブ会話を維持できます。
実生活での例
あなたが東京にいて、目的地にたどり着くために道順が必要だと想像してみましょう。しかし、残念ながらあなたは日本語をまったく話せません。
なんとかGoogle翻訳を開き、通訳モードをアクティブにして、落ち着いて簡単に英語で話します。
そして、信じられないことのように思えるかもしれませんが、アプリは即座に翻訳し、あなたのメッセージを日本語で配信(話)します。
地元の市民が道順の質問に答えると、その回答はすぐに英語に翻訳され、あなたが理解できるようになります。
驚くほど便利で、迅速で、楽です。
この機能はどのように達成されますか?
実際のところ、Google翻訳はニューラル機械翻訳 (NMT)と自動音声認識 (ASR)を使用して、多くの言語で話された言葉をリアルタイムで処理し解釈します。
このモードは、精度を向上させるために、何百万もの翻訳(インタラクション)から継続的なトレーニングを受けます。
完璧ではありませんが、念のため言っておくと、旅行、カスタマーサービス、現実世界での迅速な会話の目標に驚くほど役立ち、最も重要なときに遅延はありません。
Google翻訳によるリアルタイム翻訳(スマートフォン)(※)

2. Microsoft 翻訳者

実用的な使用
Microsoft 翻訳者は、もともとビジネスおよびプロフェッショナルな設定/シナリオ向けに設計されています。
これにより、会議、ミーティング、多言語のコラボレーションに最適です。
人々が話し、翻訳可能なテキストを作成するときに、さまざまな言語でライブキャプションと字幕を提供することができます(驚異的です)。
実生活の例
ある国際企業がイタリア、日本、スウェーデンからのチームとバーチャル会議をホスティングしています。
各人が母国語で話すと、Microsoft翻訳者は各参加者の母国語または希望する言語でリアルタイム字幕を生成して提供します。
これにより、ユーザーは人間の翻訳者や通訳者を必要とせずに、シームレスなコミュニケーションを維持できます。
したがって、人間の仕事に伴うエラーの余地を減らします。
この機能はどのように達成されますか?
Microsoft 翻訳者は、音声認識AI、ディープラーニングモデル、クラウドベースのコンピューティングを統合することに成功しています。
その組み合わせは、迅速でコンテキストに応じた翻訳/解釈を提供するための正しい方程式です。 また、最大100人の参加者との多言語会話をサポートすることができるため、グローバルビジネスの取り組みにおいて最も強力なツールの一つとなっています。
Microsoft(スマートフォン)によるリアルタイム翻訳

3. DeepL翻訳

実用化
確かに、DeepLには、ビジネスやフォーマルなやり取りのためのリアルタイムテキスト翻訳で競合他社と差別化するためのライブ音声翻訳機能がまだ含まれていません。
それにもかかわらず、DeepLは自然に聞こえる、文脈に応じた翻訳をもたらすAI翻訳搭載システムにより、精度の扱いにおいて競合他社を頻繁に凌駕しています。
実生活の理論的な例
フィンランドの企業弁護士がチリの新しいクライアントにメールを送っています。
従来の基本的な翻訳ソフトウェアを選ぶのではなく、DeepLを使うことにしました。
このツールは、入力中にリアルタイムのAI翻訳を提案することができます。情報の欠落はありません。 その結果、まるでチリの当事者が書いたかのように、スペイン語で流暢に聞こえる、完全に校正されたプロフェッショナルな印象のメッセージが完成しました。
DeepLは、単語ごとの処理にこだわるのではなく、文章やフレーズ全体を深く分析するディープニューラルネットワークを活用しています。 これにより、従来の機械翻訳システムよりも効率的にニュアンス、スタイル、トーン、深い意味を捉えることができます。
DeepL(スマートフォン)によるリアルタイム翻訳

審査員は裁定を下しました。 リアルタイムAI翻訳はここに定着しています
AIによる翻訳は、もはや私たちの想像の産物でも単なるアイデアでもありません。
それはすでに私たちの日常生活に完全に統合されています。
カジュアルな旅行のやり取りから、重要なビジネス交渉や高度に専門的な会議に至るまで、AI翻訳ツールは言語の境界を完全に曖昧にしました。
AI翻訳が完璧なワーカーである理由
- 音声認識と自然言語処理(NLP): AIは、原文の意味をこれまで以上に把握し、翻訳する前に音声をテキストに変換します。
- ニューラル機械翻訳 (NMT): 従来の単語ごとの翻訳とはまったく異なり、NMTは意味だけでなく文脈も考慮して、より自然な翻訳を生成します。
- 継続的な学習: AI モデルは、日々供給され、何百万もの現実世界の翻訳の組み合わせを分析することで、日々改善されています。
しかし、AI翻訳でさえも完全に完璧というわけではありません。 それは、日々よりスマートに、より速く、より正確になり続けているのは事実です。 それを信頼し、使用すればするほど、その過程でより良い結果が得られます。
(*)リアルタイム翻訳のすべてのテストは、Motorola g54 5 gデバイスで実行され、約4秒かかりました。