編集距離は、翻訳とローカリゼーションにおいて、特に今日のAI主導の状況において重要な指標です。 与えられたテキスト提案に対して、目的の翻訳に合わせるために行われた変更(追加、削除、または再配置)の数を測定します。 この提案は「フィード」とも呼ばれ、以下を含むさまざまなソースから提供されることがあります。
目標は、初期のフィードから最終的に確認された翻訳に移行するために必要な労力を追跡することです。
編集距離の計算方法
このメトリックがどのように機能するかを簡単な例で探ってみましょう。 フィードが「ガブリエルは市場に行った」と言っているとします。 翻訳者がそれを編集して: 「ガブリエルは市場に行った」 計算は次のようになります。
- 削除数: 「has」と「gone」 (2 編集)
- 追加: 「went」 (1 編集)
- 合計編集数: 3
- 元の文の長さ: 6ワード
- 編集距離のパーセンテージ: 3 ÷ 6 = 50%
この計算は翻訳者の努力を定量化するのに役立ちます。 場合によっては、全く新しい文が作成されると変更が100%を超えることがあり、パーセンテージを制限するか、変更の全体の範囲を反映させるかという問題が生じます。
Gabriel Fairman氏は、自身の「Edit Distance」関連ビデオシリーズで次のように説明しています。
「編集距離は通常、特定の提案に対して行われる編集の数、または翻訳者が受け取るフィードと翻訳者が確認する翻訳のことを指します」

なぜ編集距離が重要なのか
翻訳ツールがAIに大きく依存する時代において、編集距離はこれらのツールの効率と品質に関する洞察を提供します。 これには複数の利点があります。
- フィード 品質: 機械生成コンテンツを改善するためにどれだけの作業が必要かを追跡します。
- 翻訳者の労力を評価する: 翻訳を許容範囲にするために必要な手動入力の量を測定します。
- 異なる言語やコンテンツの種類を比較する: 特定の種類のコンテンツが言語間でどの程度編集を必要とするかのパターンを明らかにします。
編集時間と共に、編集距離は翻訳ワークフローの生産性と品質を測定するためのスケーラブルな方法を提供します。
課題と将来の影響
編集距離は便利ですが、制限があります。 AIが生成する翻訳が改善されるにつれて、必要な編集が少なくなる可能性があります。 この変化は疑問を提起します。
- 編集距離が短い方が常に良いですか? 必ずしもそうではなく、非常に微妙な翻訳の中には、大幅な編集が必要な場合もあります。
- 100%を超えるパーセンテージは正規化するべきですか? 大幅な書き換えが一般的な場合、パーセンテージを 100% に制限すると、平均が歪む可能性があります。
- 編集距離を補完するべき他の指標は何ですか? 編集距離のバランスを取りながら、出力の品質と翻訳者の行動を測定することが重要なものとなるでしょう。

業界が進化するにつれて、編集距離は翻訳効率を分析するための重要なツールであり続けるでしょうが、AIの進歩とともにその役割は変化します。 当社のCEOであるGabriel Fairmanによれば、
"大規模言語モデルからのコンテンツと機械翻訳エンジンの性能が向上するにつれて、機械レベルから人間レベルの翻訳への編集がますます少なくなってきています。"
編集距離は、機械生成の提案から洗練された人間による翻訳への変換を評価するための基本的な指標です。 完璧とはほど遠いですが、翻訳プロセスを測定するための正確でスケーラブルで実用的な方法を提供します。 AI技術が進化し続ける中、編集距離の監視は、翻訳が最小限の人間の努力で高い品質を維持するのに役立ちます。