編集距離は、元のコンテンツに対して翻訳されたテキストに適用された変更の割合を指します。 それは、翻訳者が望ましい結果を達成するために、どれだけa機械生成翻訳を変更するかを測定します。
たとえば、文中に 6 つの単語が含まれ、そのうち 3 つが変更、削除、または再配置された場合、編集距離は 50% になります。 この指標は、機械翻訳された出力が最終的な洗練された翻訳にどれだけ近いかを測定するための便利な指標として機能します。
言語ペアとドメインにおける変動性
編集距離は、異なる言語間だけでなく、翻訳されるコンテンツの種類によっても異なります。 複数のドメインで5,000万語以上を調査した大規模な研究によると、さまざまな言語ペアの平均編集距離は次のように記録されました。
- 英語からスペイン語: 5.5%
- 英語からフランス語: 12.4%
- 英語からデンマーク語: 4.5%
- 英語からタイ語へ: 11.8%
これらの割合の範囲は、さまざまな言語のニュアンスを強調しています。 しかし、個々のユーザーの行動は、翻訳プロセスを理解し最適化することにさらに複雑さを追加する。
.png)
翻訳におけるユーザー行動の探求
この研究で明らかになった最も興味深い側面の一つは、言語ペアやドメインに関係なく、個々の翻訳者がコンテンツをどの程度修正するかの違いでした。 例えば:
- 一部の翻訳者は1%未満の編集しか行っておらず、多くの調整をせずに単に機械翻訳を確認している可能性を示唆しています。
- 他の人は編集の最大77%を行い、元の出力のかなりの部分を書き直します。
当社のCEOであるガブリエル・フェアマンは次のように述べています。
"ユーザーがこのAI編集のことに... 飛び込んでいるのを見て... また、ユーザーがそれに... ほとんど抵抗したり、否定したりして、本当にほとんどの文を全面的に書き直す努力をしているのを見ます。"
この幅広い行動は重要な質問を引き起こします。
- 編集が少ないことは、高品質な機械の出力を示しているのか、それとも低品質な人間の監督を示しているのか?過度の編集は、徹底的な書き直しプロセスや非効率的な翻訳作業を示していますか?
編集と効率の間で正しいバランスを取る
今日の翻訳、特にAIと機械翻訳を組み合わせた場合、編集の数と全体的な生産性の間で微妙なバランスを取ることが求められます。 翻訳者は2つの主な課題に直面しています:
- 編集が少なすぎる: 重要な調整を見逃すと、不正確さにつながる可能性があります。
- 編集が多すぎます: これにより、非効率性が生じ、生産性が低下し、コストが増加する可能性があります。

当社のCEOであるGabriel Fairmanは、Edit Distance関連のビデオシリーズで次のように述べています。
"ユーザーは1%未満しか変更していないので、基本的にはただ読んで確認しているだけです... そして、他の翻訳者がそのコンテンツの77%を翻訳しており、これは平均よりも13倍以上多いです。」
最適な編集のための重要な考慮事項:
- 必要なものだけを編集します。 翻訳者は、同義語の用語(「system」を「platform」に置き換えるなど)を入れ替えるような冗長な変更を避けるべきです。
- インパクトのある編集に焦点を当てる: 固有名詞の維持や用語の修正などの重要な調整は、品質に持続的な影響を与えます。
生産性 vs. 翻訳における所有権
もう一つの課題は、翻訳された資料に対する所有権の感覚を維持することにあります。 翻訳者は、効率的に作業する必要性と、著者のように感じたいという欲求をバランスさせなければなりません。 経済的現実は翻訳者が迅速に作業を完了することを要求しますが、あまりにも多くの変更は彼らの速度を遅くし、エラーの可能性を高めるリスクがあります。
この緊張は、翻訳者がAI出力のポストエディットのようなタスクで特に顕著になります。翻訳者は、品質を向上させつつ生産性を損なわないように、ちょうど良い「スイートスポット」を見つけることを目指します。 翻訳者が非クリエイティブなコンテンツ(技術文書のような)に過度な変更を加えると、生産性が低下し、業界での重要性が危うくなる可能性があります。

理想的な編集距離の定義
最終的に、理想的な編集量、つまり「良い」とは何かを決定することは、言語ペアだけでなく、ユーザーの行動やコンテンツの種類にも依存します。 翻訳者が競争力を維持するためには、スピードと正確さのバランスを取りながら適応することを学ばなければなりません。 過度または最小限の編集にはリスクが伴い、正しいバランスを見つけることによってのみ、生産性と品質を維持できます。
AIコンテンツのポストエディティングにおけるこの最適なバランスを達成するための旅はまだ続いていますが、編集距離のダイナミクスを理解することは、今後の課題と機会を見通すための貴重な視点を提供します。