過去40年間、機械翻訳 (MT)は翻訳業界を分断してきました。 研究者とエンタープライズの購入者はそれを効率化ツールとして称賛することが多い一方で、多くの翻訳者はそれほど熱心な経験をしていません。 この分断は、従来の機械翻訳ポストエディット(MTPE)の限界に集中しており、人間の翻訳者が編集者として機械の出力を修正することを強いられ、彼らの専門知識を直接活かすことができないという問題を引き起こしています。
しかし、Bureau Worksの新しいコンテキストセンシティビティ機能がそのストーリーを変えています。 AIとリアルタイムのコンテクスト学習を組み合わせることで、このツールはMTPEを反復的でフラストレーションの多いプロセスから、翻訳者がその専門知識を十分に活用できる、より迅速で正確かつ動的なものに変えています。
従来のMTPEの問題
長年にわたり、MTPEのプロセスは著しく静的でした。 翻訳者は完全に機械翻訳された文書を受け取り、それを編集して、機械翻訳、翻訳メモリ (TM)、および用語データベース (TB) 間のエラーと不一致を修正しなければなりません。 このセットアップの問題は、翻訳者が常に同じ種類のエラーを繰り返し特定する受動的なモードに追い込まれ、修正から機械がリアルタイムで学習しないことです。
さらに、これらの事前に翻訳されたファイルは進化しません。 機械が試みを行うと、ドキュメントは所定の位置に凍結され、人間がそれをクリーンアップすることになります。 翻訳モデルは時間とともに学習しますが、それは通常、大量の文書が処理され、システムにフィードバックされた後のことであり、翻訳者が作業中に役立つ形ではありません。
この環境では、翻訳者はしばしば同じ間違いを単語ごとに修正しているように感じます。 彼らの役割は「エラー発見者」の役割に縮小されているように感じられ、翻訳の創造的で知的な側面は取り除かれています。 これに加えて、MTPE作業の報酬はしばしば低く、それがフラストレーションをさらに追加する。
コンテキストセンシティビティを入力
Bureau Worksのコンテキストセンシティビティは、MTPEワークフローを完全に再構築します。 事前に翻訳された固定文書を扱う代わりに、翻訳者は今や彼らの入力からリアルタイムで学習する動的なシステムを持っています。
コンテキストセンシティビティは、プロジェクトの翻訳メモリ、用語集、および機械翻訳を積極的に検索して、テキストの特定のコンテキストに一致する提案を提供します。 しかし、それを際立たせているのは、翻訳者が作業するにつれて学習する能力です。 編集が行われると、システムは即座に適応し、更新された知識をワークフローにフィードバックするので、翻訳者が同じ問題を繰り返し修正することに陥ることはありません。
このシステムは、次のような時間のかかる低レベルのタスクも処理します。
翻訳が翻訳メモリと一致していることを確認する
用語がプロジェクト用語集と一致していることを保証する
曖昧な一致をより正確なものにアップグレードする
その結果、翻訳者は基本的な一貫性チェックに煩わされることなく、トーン、スタイル、声を正しくするという本当に重要な高レベルの作業に集中できます。
.jpeg)
翻訳の匂い: 手助け
さらに簡単にするために、Bureau Worksは翻訳者が作業中に潜在的な問題を指摘するツールであるTranslation Smellsを導入しました。 この機能は、次のような意味論的な問題がないかリアルタイムで翻訳をスキャンする、第二の目のようなものです。
追加や省略
不正確または不自然な翻訳
性別バイアス
主語と動詞の一致の問題
.jpeg)
不自然な文構造
これらの問題を早期に発見することで、Translation Smellsは翻訳者がより効率的かつ自信を持って作業できるようにします。 間違いを探すのに時間を費やす代わりに、システムはそれらを指摘するのを助け、翻訳者に翻訳の全体的な品質に集中するためのより多くの時間を与えます。
さらに、システムの学習は継続的です。 翻訳者がセグメントを確認するたびに、システムは自動的にナレッジベースを洗練し、新しい用語を抽出し、翻訳を即座に調整します。 これにより、時間のかかる正式なトレーニングセッションが不要になり、プラットフォームを使用しながら改善することができます。
既存の翻訳メモリを最適化したい方のために、Bureau Worksは、セマンティック分析を使用して翻訳メモリをクリーンアップし、洗練するツールであるTMillも提供しています。 これにより、過去の作業が有用であり続け、将来の翻訳の品質向上に役立ちます。
実世界の結果
Bureau Worksは最近、従来のニューラルMTPEと新しいコンテキストセンシティビティ機能のパフォーマンスを比較するための調査を実施しました。 結果は自ずと明らかです。
重要な見つける:
生産性の向上: コンテキストセンシティビティを使用する翻訳者は、効率が22%向上しました。 Translation Error Rate (TER) は 0.162 から 0.128 に低下し、初期の機械出力に対する編集が少なくて済むことを意味します。
地域差が重要です: 一般的なスペイン語翻訳のTERは0.151でしたが、特定の地域(スペインとラテンアメリカ)のスペイン語は、それぞれ0.055と0.062と、はるかに優れたパフォーマンスを示しました。 これは、システムのコンテキスト認識が地域のニュアンスにうまく適応していることを示しています。
言語間の一貫性: 従来のニューラルMTPEは異なる言語間でさまざまな結果を示しましたが、コンテキストセンシティビティはより一貫していました。 たとえば、デンマーク語が最良の結果を示し、簡体字中国語はより困難でしたが、それでもどちらもシステムのアプローチの恩恵を受けました。
翻訳者としての著者、編集者ではなく
コンテキストセンシティビティにより、翻訳者は真の翻訳者としての役割を取り戻すことができます。 単に機械のエラーを修正するのではなく、最初から意味のある正確な翻訳を作成する権限を与えられています。 その技術は反復的で低レベルのタスクを処理し、翻訳者が創造性と専門知識を必要とする作業の部分に集中できるようにします。
翻訳の新しい進むべき道
Bureau Worksのコンテキストセンシティビティは、翻訳に対する考え方を変えています。 機械翻訳のスピードと人間の洞察のニュアンスを組み合わせることで、翻訳者にとってよりダイナミックで効率的、かつやりがいのあるワークフローを作成する。
反復的で静的なプロセスにとどまるのではなく、翻訳者は今、リアルタイムで学習し、彼らの好みに適応し、Translation Smellsのようなインテリジェントなツールでサポートするシステムで作業しています。 結果として、より高い品質の翻訳、より迅速な対応、そしてより満足した翻訳者が得られます。 テクノロジーが進化し続ける中、これが翻訳の新時代の始まりに過ぎないことは明らかです。