市場に参入したいと焦っていると、機械翻訳の限界が見落とされることがあります。 MTは便利なツールになり得ますが、トータルソリューションではありません。 完全なソリューションではなく、ローカリゼーションの補助として使用する覚悟がある限り、標準を維持しながらそのメリットを享受することができます。MTと人間による翻訳は相互に排他的ではありません。 MTは生産性向上ツールです。 翻訳者がより速く作業し、より高い品質の結果を得るのに役立ちます。 場合によっては、専門的に作成されたシステムを使用して、製品の重要な部分を自動化することさえ可能です。 ただし、スタンドアロンのローカリゼーションのソリューションであることはめったにないため、その制限を理解するのが賢明です。
機械翻訳の限界内で自動化を楽しむ
機械翻訳の限界は、しばしば限られたデータと共にやってくる。 MTはデータを使用して翻訳者に提案を行うように訓練されています。 効果的な機械翻訳プログラムを作成するには、少なくとも100万語の高品質な人間が翻訳したコンテンツが必要です。
これは、コーパスまたはテキストコーパスとも呼ばれるこのトレーニングデータにアクセスできないため、ほとんどの企業が直面する最大の問題です。これらのエンジンをトレーニングするためのデータがある場合でも、技術文書のように、非常に主題に特化したものであることがよくあります。 その簡潔な情報は非常に事実に基づいており、パターンを使用してフォローすることで多くのコンテンツの翻訳を自動化できます。
そのため、通常、素材の価値が非常に低く、頻繁に閲覧されず、「個性」を多く持つように設計されていない場合にMTを使用するのが最適です。さらに、MTを翻訳を自動化する方法と見ている人の多くは、費用を節約したいと考えています。 しかし、機械翻訳を訓練するためには、システムを効果的に構築するためにコンテンツ作成とデータマイニングに多大な投資をしなければならず、それがプロジェクトからのROIを損なうことになるでしょう。
予算は、多くの機械翻訳プロジェクトがシステムの作成が人間の翻訳者に管理させるよりも高くつくことを学ぶところで崩壊します。最後に、機械翻訳の最も重要な制限の1つは、人間の翻訳者自身から来ています。 MTが最初に登場したとき、「十分」という概念から、MTを使用することに対して多くの抵抗がありました。 翻訳者は、MTコンテンツを「微調整」するだけで良くなると言われましたが、しばしば何が良いとされる基準が与えられませんでした。 その上、これらのツールは彼らの給与率を下げ、生産性目標を引き上げました。 その結果、MTを使用し、ポストエディットで補完する際には、最適なコンテンツのために明確な基準と標準を設定する必要があります。
品質のための機械翻訳の評価
機械翻訳のもう一つの限界は、品質を判断するための標準化が欠けていることです。 バイリンガル評価アンダースタディ(BLEU)は、最も一般的に受け入れられているベンチマークですが、いくつかの致命的な欠陥に悩まされています。 固定された基準を使用しているため、品質の向上を測定するというよりも、厳格な構造に従うことに重点が置かれています。 そのため、BLEUスコアが翻訳の成功を判断する唯一の基準であってはなりません。翻訳の基準成功のための基準は、次のような客観的で人間中心の基準から得られるべきです。
- MTコンテンツの使用後、収益は下がりましたか、それとも上がりましたか?
- ユーザーからの苦情は少なかったですか?
- ユーザーはソフトウェアをよりうまくナビゲートし、さらに進みましたか?
- 編集距離—機械翻訳から人間による編集を経て成功したコンテンツに至るまでの時間—は減少しましたか?
機械翻訳の限界を理解するための最良の指標は、ユーザー主導です。 苦情が減ると、収益は増加し、人々はソフトウェアをさらに深く利用します。 この場合、彼らがコンテンツを理解し、それに関与していることが簡単にわかります。 また、教材が構築されるにつれて、データへのアクセスが増えることで、プログラムのトレーニングが向上します。 このシステムが最終的なソリューションではなくツールである限り、ほとんどのMTの取り組みは、制限にもかかわらず投資する価値があります。