翻訳メモリソフトウェア: 知っておくべきすべてのこと
翻訳メモリソフトウェアとは何ですか?
翻訳メモリ (TM) ソフトウェア は、コンピュータ支援翻訳 (CAT) ツール の一種で、翻訳されたフレーズや文を 翻訳メモリデータベース*と呼ばれるデータベースに保存します。 このデータベースは、将来の翻訳で類似したフレーズを自動的に一致させ、事前に翻訳するために使用でき、翻訳プロセスの一貫性と効率を向上させるのに役立ちます。翻訳および翻訳メモリデータベースソフトウェアは、時間の経過とともに変更や修正を追跡し、同じドキュメントまたはプロジェクトで作業する際に情報を共有することもできます。
翻訳メモリは決して古くはありませんし、少なくとも古くあってはなりません。 選択、翻訳、編集、保存を行う間に、TMは成長し学習し続けます。過去の翻訳から異なる一致率を認識し、一貫性を高め、ワークフローを加速します。 プロジェクト間および各特定の最終クライアントに対して、用語の一貫性を確保するのに役立ちます。
TMシステムは、大規模なプロジェクトや定期的な翻訳作業の親友です。 初めての日次翻訳タスクに更新を追加することが、TMシステムのおかげで可能です。
それはどのように機能しますか?
.webp)
翻訳メモリソフトウェア は、通常、文やフレーズに分割して、翻訳するテキストファイルをセグメントに分解します。 各セグメントは、その後、翻訳メモリデータベース内のセグメントと比較され、一致があるかどうかを確認します。 一致が見つかった場合、データベースからの対応する翻訳がターゲットテキスト(ソーステキストの翻訳バージョン)に自動的に挿入されます。
一致がない場合、翻訳者は新しいものを作成し、それが将来の使用のためにTMに追加されます。 ソフトウェアは進むにつれて学習を続けるため、繰り返しのあるコンテンツを含むプロジェクトにとって唯一の選択肢となります。 とはいえ、完全な一致であっても、文脈が変わったり、微妙なことがあちこちにあったりすると、的外れになる可能性があるため、人間によるレビューは依然として重要です。
そのソフトウェアは通常、「ファジーマッチング」と呼ばれるプロセスを使用して一致を見つけるため、完全に同じではないが、類似したセグメントを識別できます。 これは便利です。なぜなら、ソーステキストとコンテキスト内のセグメントの間にわずかな表現やフォーマットの違いがあっても、一致を可能にするからです。翻訳メモリ

Source: Redokun
セグメントが 翻訳メモリに一致しない場合、翻訳ソフトウェアはそれを「未翻訳」としてフラグを立て、翻訳者が翻訳メモリを使用して新しいものを提供できるようにします。
その ソフトウェア は、新しい翻訳を 翻訳メモリに保存することもできます。 これにより、新しい翻訳を将来の翻訳で再利用でき、翻訳プロセスの効率と一貫性が向上します。
全体として、翻訳メモリソフトウェアは、大量のテキストを頻繁に翻訳するフリーランスの翻訳者、翻訳会社、その他の組織にとって貴重なツールとなり得ます。
いつ発明されたのですか?
翻訳メモリソフトウェア は1980年代に初めて開発されました。 最初の商用 翻訳メモリシステム は「Metatex」と呼ばれ、1989年に「Star」社によって開発されました。 翻訳メモリ技術 の概念は、以前の翻訳をデータベースにまとめて保存し、類似したフレーズや文を含む将来のプロジェクトで再利用することに基づいており、これにより翻訳プロセスの一貫性と効率が向上します。
最初の TMシステムの導入以来、技術は継続的に進化し改善されており、時間とともに新しい機能や能力が追加されています。 例えば、多くの最新のTMシステムには、高度なファジーマッチングアルゴリズム、ファイル形式のサポート、他のCATツールや機械翻訳システムとの統合機能が含まれています。現在、翻訳メモリソフトウェアは、翻訳メモリの標準ツールとして業界で広く使用されており、翻訳プロセスの効率性、一貫性、コスト削減を助けています。 なぜそれが重要なのですか?
2025年における最高の翻訳メモリソフトウェア

SDL Trados - 業界で最も使用されている翻訳メモリソフトウェアです。 Trados + SDLの融合から生まれました。

MemoQ - 翻訳者に愛されているMemoQは、優れた 翻訳編集UI

Phrase - 元々はMemsourceで、最初のクラウドファースト 翻訳管理システムの一つでした。 MemsourceがPhraseを買収した後、Phraseに改名しました。 ファイルベースおよび文字列ベースのローカリゼーションの両方をサポートします。

Bureau Works - 元々はエンタープライズ専用の 翻訳管理、品質管理、およびビジネス管理システムとして設計されており、Bureau Worksはお見積もりから支払い自動化まで、あらゆる側面を統合して小規模から 大規模なローカリゼーション ユースケースを管理します。

Crowdin - Crowdinをソフトウェアのローカリゼーションツールとして使用することで、重要な利点は600以上のツールとの統合にあり、シームレスなコンテンツ翻訳体験を可能にします。 多言語コンテンツの管理を中央の場所で統合し、自動化されたプロセスで生産性を向上させることができます。

Smartling - 最も採用されているエンタープライズ 翻訳管理システムの一つで、Web-Proxy翻訳に注力し、サービスも提供しています。

Transifex - 最初はオープンソースコミュニティで注目されていたTransifexは、開発者に広く採用されており、Web-Proxyソリューションも提供しています。
翻訳メモリ、用語集、スタイルガイド
TMはそれ自体で非常にパワフルですが、用語集やスタイルガイドと組み合わせると、さらに無敵になります。 用語集は、業界固有の用語の一貫した翻訳を保証し、スタイルガイドは、トーン、文法、フォーマット、および最終的なクライアントの好みに関するルールを設定します。
翻訳メモリ (TM), 用語集, and Style Guides は翻訳の一貫性と 品質を向上させるために使用されるツールです。 ただし、それぞれに異なる目的があります。
- 翻訳メモリ (TM)は、以前に翻訳されたフレーズや文のデータベースであり、将来の翻訳で類似したフレーズを自動的に一致させて事前に翻訳することができます。 TMの主な目的は、翻訳プロセスの一貫性と効率を向上させることです。
- 用語集 は、特定の主題や業界に特有の用語とその翻訳の一覧です。 翻訳全体で特定の用語を使用する際の一貫性を確保するのに役立ちます。 用語集は、翻訳が文脈に対して正確で適切であることを保証するのにも役立ちます。
- スタイルガイドは、特定の言語または特定の対象ユーザー向けにテキストを作成および書式設定するためのガイドラインとルールを提供するドキュメントです。 文法、句読点、書式設定、およびその他の言語固有の規則の一貫性を確保するのに役立ちます。
要約すると、翻訳メモリと用語集は主に翻訳の一貫性と正確性に焦点を当てているのに対し、スタイルガイドは主にテキストの一貫性と明確さに焦点を当てています。 彼らは皆協力して翻訳の品質を向上させ、翻訳されたテキストがターゲット言語とオーディエンスに対して一貫性があり、適切であることを保証します。
翻訳メモリ vs. 機械翻訳: それらはどのように異なりますか?

源: 機械翻訳
TMとMTはリンゴとオレンジのようなもので、異なるタスクを果たしますが、一緒に素晴らしく機能することができます。
翻訳メモリ (TM)と 機械翻訳 (MT)はテキストを翻訳するために使用できるツールですが、それぞれ異なる方法で動作し、異なる強みと弱みがあります。
翻訳メモリ (TM) は、過去に翻訳されたフレーズや文のデータベースであり、将来の翻訳で類似したフレーズを自動的に一致させて事前に翻訳することができます。 TMの主な目的は、翻訳プロセスの一貫性と効率を向上させることです。 それは主に繰り返しや類似したコンテンツに使用され、人間の翻訳者が彼らの作業を支援するために主に使用するツールです。
一方で、 機械翻訳 (MT)は、アルゴリズムとニューラルネットワークを使用して、テキストをある言語から別の言語に自動的に翻訳します。 MTの主な利点は、大量のテキストをすばやく翻訳し、複数の言語で作業できることです。 ただし、MTによって生成される翻訳の品質は、テキストの複雑さやMTシステムの訓練に使用される訓練データの品質に応じて大きく異なる場合があります。 また、人間の翻訳者が持つ文化的および慣用的な理解も欠けています。
要約すると、翻訳メモリ(TM)は主に繰り返しや類似のコンテンツに使用され、人間の翻訳者がその作業を支援するために主に使用します。機械翻訳(MT)は主に大量のテキストに使用され、複数の言語で動作することができます。 それでも、その品質はテキストの複雑さやトレーニングデータの品質に応じて大きく異なる場合があります。 どちらも翻訳プロセスで一緒に使用でき、TMを使用してMT出力を強化し、より正確で一貫性のある翻訳を実現します。
最大のアプローチは? それらを組み合わせてください。 速度のためにMTを使用し、TMで出力を磨いてより細かい結果を得ることができます。
翻訳メモリはいつ使用すべきですか?
翻訳メモリは、プロの翻訳ワークフローにとってパンドラの箱でした。 最初は、私たち翻訳者はこの新しさに祝福されていると同時に呪われていると感じました。 それにもかかわらず、過去の翻訳を再利用することで、繰り返しのあるコンテンツを再翻訳する必要がなくなることを私たちは時間をかけて学びました。 これにより、時間とお金を節約できます。 一貫性を保つのに非常に役立ち、締め切りが厳しい場合(明らかに99%の時)の命の恩人です。
TMを使用すると役立つ特定の状況は次のとおりです。
大量の類似または同一のコンテンツを翻訳する必要がある場合、たとえば、複数の言語に翻訳する必要があるウェブサイト、バイリンガルデータベース、または製品カタログがあるとします。 その場合、TMは以前に翻訳されたコンテンツを再利用することで、一貫性と効率性を確保するのに役立ちます。
同じドキュメントの複数のバージョンを翻訳する必要がある場合、例えば、頻繁に更新する必要があるユーザーマニュアルがある場合、TMはマニュアルの以前のバージョンから既存の翻訳を再利用することで、一貫性を確保するのに役立ちます。
頻繁に更新されるコンテンツを翻訳する必要がある場合、例えば、ニュースサイトや頻繁に更新されるブログを持っている場合、TMは以前の翻訳記事からの翻訳を再利用することで、一貫性と効率性を確保するのに役立ちます。
同じプロジェクトで複数の翻訳者と作業する必要がある場合、TMは他のチームメンバーの翻訳を見て再利用することで、一貫性を確保するのに役立ちます。
全体として、翻訳メモリソフトウェアは、大量のテキストを頻繁に翻訳し、複数の翻訳にわたって一貫性と効率を維持する必要がある翻訳者、翻訳会社、その他の組織にとって貴重なツールとなり得ます。

Bureau Works TM
創造的なテキストは翻訳メモリには最適ではありませんが…
創造的なテキスト、例えば文学、詩、または広告コピーは、しばしば高い創造性、比喩的な言語、および簡単に単純な逐語訳では翻訳できない慣用表現を含むため、翻訳メモリ (TM)には最適ではありません。さらに、創造的なテキストは、翻訳メモリで捉えるのが難しい独自のスタイルとトーンを持つことがよくあります。 たとえば、創造的なテキストでは、比喩、駄洒落、そして一貫して正確に翻訳するのが難しいその他の文学的手法が使われていることがあります。
しかし、創造的なテキストを扱う場合でも、TMを使用して翻訳プロセスの一貫性と効率を向上させることができます。 これを行う 1 つの方法は、TM を使用して、テキスト全体で使用される一般的なフレーズ、同じ単語、および文の翻訳を保存することです。 これにより、翻訳されたテキスト全体の用語と言い回しの一貫性を確保できます。 これは、たとえば、これらのテキストで頻繁に繰り返されるスローガンや免責事項に当てはまります。
特定のテキストセグメントを事前に翻訳するためにTMを使用し、その後、プロの翻訳者が翻訳をレビューして、言語の専門家の現在の状況に適していることを確認することも可能です。
全体として、クリエイティブなテキストはTMに最適ではないかもしれませんが、それでも 翻訳プロセスの一貫性と効率を向上させるために使用することができます。 それでも、人間の翻訳者と併用し、編集することは、可能な限り最良の結果を確保するために重要です。
異なる反復的なコンテンツの種類は、翻訳メモリツールの恩恵を受けることができます
多くの種類の反復的なコンテンツが、翻訳メモリ(TM)ツールを使用することで恩恵を受けることができます。 次に例をいくつか示します。
技術文書
技術マニュアル、ユーザーガイド、およびその他の種類の技術文書には、多くの場合、高度な繰り返しが含まれており、テキスト全体で多くの類似したフレーズや文が使用されています。 TMは、これらのタイプのドキュメントを翻訳する際の一貫性と効率性を確保するのに役立ちます。
ソフトウェアとウェブサイトのローカリゼーション
ウェブサイトとソフトウェアアプリケーション には、メニュー項目、エラーメッセージ、インターフェース全体で繰り返し使用されるその他のテキストタイプなど、高度な繰り返しが含まれることがよくあります。 TMは、この種のプロジェクトのローカリゼーションプロセスにおける一貫性と効率性を確保するのに役立ちます。

マーケティングと広告資料
パンフレット、広告文、その他のマーケティング資料には、スローガンや製品名、その他の繰り返し使用されるテキストなど、高度な繰り返しが含まれることがよくあります。 TMは、これらのタイプのドキュメントを翻訳する際の一貫性と効率性を確保するのに役立ちます。
.webp)
契約書、合意書、法的形式などの法的文書
法的文書には、文書全体で繰り返し使用される法律用語やフレーズなど、高度な繰り返しが含まれていることがよくあります。 TMは、これらのタイプのドキュメントを翻訳する際の一貫性と効率性を確保するのに役立ちます。

医療および科学文書
医療および科学文書 多くの場合、文書全体で繰り返し使用される専門用語や語句など、高度な繰り返しが含まれています。 TMは、これらのタイプのドキュメントを翻訳する際の一貫性と効率性を確保するのに役立ちます。
要約すると、テキスト、フレーズ、または文のいずれであっても、繰り返しのあるコンテンツは、翻訳メモリ (TM)ツールを使用することで、翻訳プロセスの一貫性と効率を確保しながら、時間とコストを節約することができます。

翻訳メモリの利点は何ですか?
翻訳メモリ により、次のことが可能になります:
- 同じ文を二度と翻訳しない
- 同じコンテンツを再翻訳しないことでお金を節約
- 翻訳可能なコンテンツとしてカウントせず、納期を短縮することで時間を節約
- 過去の翻訳を参照することで一貫性を向上
- 類似した文構造を認識
- 部分的に翻訳された文を提供し、翻訳者が「空欄を埋める」だけで済むことでお金を節約
- 部分的に翻訳された文を提供することで時間を節約
- 過去の類似した翻訳を参照することで一貫性を向上
法的および財務的テキストのアプリケーション
法的
- 契約翻訳: TMテクノロジーは、法的な契約や合意書の翻訳に使用でき、すべての翻訳の一貫性、正確性、最新性を確保します。 TMデータベースから以前に翻訳されたセグメントを再利用することで、新しい契約書の翻訳に必要な時間とリソースを削減しつつ、翻訳の一貫性と正確性を向上させることができます。
- 法律用語: 法律文書には、多くの場合、法律分野に固有の専門用語やフレーズが含まれています。 TMテクノロジーは、これらの用語をTMデータベースに保存して再利用することにより、これらの用語の使用に一貫性を確保するのに役立ちます。 これにより、すべての法的翻訳が一貫して正確であり、エラーや不一致のリスクを軽減するのに役立ちます。
- 訴訟サポート: TM技術は、法務チームが簡単にアクセスできる翻訳の集中データベースを提供することで、訴訟をサポートするために使用できます。 これは、重要な文書や証拠の翻訳が重要となる多言語訴訟において特に役立ちます。 TM技術の利点を活用することで、法務チームは関連する翻訳を迅速に取得し、それらが正確で最新であることを確認できます。
財務
- 財務報告: TMテクノロジー は財務報告を翻訳するために使用でき、すべての翻訳が一貫性があり、正確で、最新であることを保証します。 TMデータベースから以前に翻訳されたセグメントを再利用することで、新しいレポートの翻訳に必要な時間とリソースを削減しつつ、翻訳の一貫性と正確性を向上させることができます。
- 金融用語: 金融テキストには、多くの場合、金融業界に固有の専門用語やフレーズが含まれています。 TMテクノロジーは、これらの用語をTMデータベースに保存して再利用することにより、これらの用語の使用に一貫性を確保するのに役立ちます。 これにより、すべての financial translations が一貫性と正確さを保ち、エラーや不一致のリスクを軽減するのに役立ちます。
- 規制コンプライアンス: 金融業界では、規制に対するコンプライアンスが重要です。 TM技術は、翻訳の集中データベースを提供することで、翻訳が規制に準拠していることを確認し、簡単にレビューおよび更新することができます。 これにより、すべての financial translations が正確で最新であることを保証し、エラーや不一致のリスクを軽減します。
技術文書および製品マニュアル
- ユーザーマニュアル: 技術製品のユーザーマニュアルには、詳細な注意書きや仕様が含まれていることがよくあります。 TM technology は、TMデータベースに以前翻訳されたセグメントを保存して再利用することで、すべてのマニュアル翻訳が一貫性があり、正確で最新であることを保証するのに役立ちます。 これにより、ユーザーが複数の言語で正確で一貫性のあるユーザーマニュアルにアクセスできるようになります。
- 技術仕様: 製品の技術仕様には、製品の機能、機能性、性能に関する詳細な情報が含まれていることが多いです。 TM技術 は、以前に翻訳されたセグメントをTMデータベースに保存し再利用することで、すべての技術仕様の翻訳が一貫性があり、正確で最新であることを保証するのに役立ちます。 これにより、エンジニア、技術者、営業チームを含むすべての関係者が、複数の言語で正確かつ一貫した技術仕様にアクセスできるようになります。
- ソフトウェアのローカリゼーション: ソフトウェア製品の技術文書 には、ユーザーインターフェース、ヘルプファイル、リリースノートが含まれることがよくあります。 TMテクノロジーは、以前に翻訳されたセグメントをTMデータベースに保存して再利用することにより、ソフトウェアの技術文書のすべての翻訳が一貫性、正確性、最新であることを保証するのに役立ちます。 これにより、ソフトウェアユーザーが複数の言語で正確で一貫性のあるソフトウェアドキュメントにアクセスできるようになります。
完全一致とあいまい一致
の文脈で 翻訳メモリ (TM) ソフトウェアでは、「完全一致」と「あいまい一致」は、ソーステキスト(翻訳されるテキスト)のセグメントと 翻訳メモリデータベース
内のセグメントとの類似度を指します。「完全一致」は、ソーステキストのセグメントが 翻訳メモリデータベース 内のセグメントと(テキストを囲むすべての書式設定とコードを含む)完全に一致する場合に発生します。 この完全一致は、2 つのセグメントの文言、書式設定、およびコンテキストが同一であることを意味します。 完全一致は最高の品質の一致と見なされます。翻訳メモリの交換は、正しいという高い確信を持って同じターゲットファイルのテキストに自動的に挿入されることができます。
「ファジーマッチ」は、ソーステキストセグメントが類似しているが、翻訳メモリデータベース内のセグメントと完全には一致しない場合に発生します。 つまり、2 つのセグメントの文言、書式設定、またはコンテキストは異なる場合がありますが、全体的な意味は同じです。 ファジーマッチは、完全または同一のマッチよりも低い品質のマッチと見なされます。翻訳メモリの作業は、現在のコンテキストに適していることを確認するために、見直しや調整が必要な場合があります。 通常、ソフトウェアは一致率スコアを使用して、ソーステキストとデータベース内のセグメントとの間の類似性のレベルを示します。
要約すると、完全一致とは、テキストのソースと TM 内のセグメントの両方が完全に一致することであり、あいまい一致は類似しているが同じではない一致です。 完全な一致は、最高の品質の一致と見なされます。 翻訳は高い信頼性で自動的に挿入できます。 対照的に、ファジーマッチは低い品質のマッチと見なされ、翻訳は挿入される前にレビューが必要かもしれません。
翻訳メモリを使用する際のベストプラクティスにはどのようなものがありますか?
翻訳の一貫性と効率を向上させるための翻訳メモリ(TM)の使用に関するベストプラクティスを以下に示します。
- 高品質なTMを作成することから始めます。 TMを使用し始める前に、正確で適切な翻訳が含まれた高品質な翻訳メモリを持っていることを確認することが重要です。 これは、以前に翻訳されたコンテンツからTMを作成するか、プロの翻訳者にTMをレビューして編集してもらうことで行うことができます。
- 一貫性のある用語を使用します 。 翻訳の一貫性を確保するには、TM全体で一貫した用語を使用することが重要です。 これは、用語集を作成し、その翻訳を使用して、TM内の類似したフレーズや文を事前に翻訳することで達成できます。
- 定期的に更新し、TMを維持する: 新しいコンテンツを翻訳し続ける際には、新しい翻訳を追加し、古いまたは誤った翻訳を削除することで、TMを定期的に更新し、維持することが重要です。 これにより、TMが時間の経過とともに最新かつ正確な状態に保たれるようになります。
- 他のツールと併用してTMを使用する: 翻訳メモリソフトウェア は、用語集やスタイルガイドなどの他のツールと併用することで最も効果的に機能します。 翻訳の一貫性と正確性を確保するのに役立ちます。
- 適切なTM一致レベルを使用します: 翻訳メモリソフトウェア は、各セグメントの一致レベルを設定することができます。 各セグメントに適切な一致レベルを使用することは、最も適切な翻訳を使用するために重要です。 たとえば、以前に翻訳された部分に対して完全一致を使用し、類似しているが完全には同じでないセグメントに対してファジー一致を使用する場合です。
- 翻訳をレビューおよび編集します: TMによって生成された翻訳を常にレビューおよび編集して、現在のコンテキストに正確で適切であることを確認してください。
- 特定のコンテンツでTMをトレーニングする: 特定のドメインや業界で作業している場合、翻訳の精度と一貫性を向上させるために、特定のコンテンツや用語でTMをトレーニングすることが重要です。
これらの実践により、あなたのTMは、最終的な顧客、スタイル、タイプ、業界に関係なく、信頼性が高くパワフルなツールであり続けます。

翻訳メモリを最大限に活用するためには、翻訳前にソーステキストに注意を払うことが重要です
ソース言語のコンテンツを最適化して、翻訳メモリ(TM)ツールの使用を最大化する方法はいくつかあります。
- 一貫性のある用語を使用します 。 ソース言語のコンテンツ全体で一貫した用語を使用することは、翻訳の一貫性を確保するために重要です。 これは、用語集を作成し、それらの翻訳を行い、ソース言語のコンテンツ内の類似したフレーズや文を事前に翻訳することで達成できます。
- 一貫性のある書式設定を使用します 。 ソース言語のコンテンツの一貫したフォーマットは、TMがセグメントを認識し、一致させるのに役立ちます。 たとえば、同じ句読点、大文字と小文字、スペースを使用すると、TM は類似したセグメントをより正確に識別して一致させることができます。
- 一貫性のある構造を使用します 。 ソース言語のコンテンツに一貫した構造を持たせることは、TMがセグメントをより簡単に認識し、一致させるのにも役立ちます。 たとえば、同じ見出し、箇条書き、番号付きリストを使用すると、TM は類似するセグメントをより正確に識別して一致させることができます。
- 一貫性のあるコンテキストを使用します 。 ソース言語のコンテンツの一貫したコンテキストは、TMがセグメントを認識し、一致させるのをより容易にすることもできます。 たとえば、ユーザーマニュアルを翻訳し、特定のステップの正確な注意書きを使用する場合、TMは注意書きをより簡単に一致させることができます。
- 慣用表現を避ける : 慣用表現は翻訳が難しく、TMと一致しないことがよくあります。それらを避けるか、控えめに使用するのが最善です。
- プレースホルダー を使用します。 ソース言語のコンテンツでは、日付、数字、名前などの変数を表すためにプレースホルダーを使用できます。 これにより、ソース言語のコンテンツが変更されても、これらの変数の翻訳の一貫性を確保するのに役立ちます。
これらのベストプラクティスに従うことで、TMの使用を最大化し、翻訳の一貫性と効率を向上させるために、ソース言語のコンテンツを最適化できます。
翻訳メモリの活用を最大化するために書き直すことができる文の例:
ここでは、異なる方法で書かれているが、互いに同じように書き直すことができる文の10の例を紹介します。
- "CATがマットの上に座った" と "猫がラグの上でくつろいでいた。"
- "私は公園で会います" と "私たちは緑地で会合します。"
- "私は赤い車を持っています" と "私は赤い色の車両を所有しています。"
- "本をください" と "親切に書物を提供してください。"
- "私は店に行きます" と "私は施設に向かっています。"
- "彼は背の高い男です" と "彼は高い身長を持っています。"
- "犬が大声で吠えた" と "犬が大きな音を立てた。"
- "後で電話します" と "後で問い合わせ先します。"
- "私は幸せです" と "私は喜びの状態にあります。"
- "食べ物は美味しかった" と "料理は味わい深かった。"
これらの文章は、構造や言葉遣いが異なるように聞こえるかもしれませんが、それでも同じメッセージを伝えています。 A 翻訳メモリシステム はこれらの文を一致させ、同じ翻訳を提供することで、テキスト全体の一貫性を確保できます。
品質の高い翻訳メモリを作成する方法は?
高品質な翻訳メモリ(TM)を作成することは、翻訳の一貫性と効率を確保するために不可欠です。 高品質なTMを作成するために取ることができるいくつかのステップは次のとおりです。
- 白紙の状態から始めます: TMを作成する前に、データベースから古い翻訳や不正確な翻訳を削除して、白紙の状態から始めることが不可欠です。
- ソースコンテンツを集めて整理する: ソースコンテンツをすべて収集し、TMに含めたいものを整理して、見つけやすく参照しやすくします。 これは、スプレッドシート、データベース、またはドキュメント管理システムの形式である可能性があります。
- 使用する 一貫した用語: ソースコンテンツ全体で一貫した用語を使用することは、翻訳の一貫性を確保するために重要です。 これは、用語集を作成し、その翻訳を使用して、ソースコンテンツ内の類似したフレーズや文を事前に翻訳することで達成できます。
- あなたのソースコンテンツを翻訳する: プロの翻訳者を使用して、ソースコンテンツを翻訳してください。 翻訳者があなたの業界と専門分野で経験豊富であることを確認してください。
- 翻訳をレビューおよび編集します: プロの翻訳者にレビューしてもらい、現在の文脈に適しているかどうかを確認してください。
- 翻訳をTMに保存します。 レビューと編集が完了したら、それらをTMに保存し、見つけやすく参照しやすい方法で管理してください。
- TMを最新の状態に保ちます: 新しいコンテンツを翻訳し続ける際には、新しい翻訳を追加し、古いまたは誤った翻訳を削除することで、TMを定期的に更新し、維持することが重要です。
- ドメイン固有のコンテンツ: 特定のドメインまたは分野で作業している場合は、その分野に対して単一のTMを使用し、他のドメインと混在させないでください。
大規模な翻訳メモリを管理する方法
大きな 翻訳メモリ (TM)を管理することは挑戦的ですが、いくつかの戦略がプロセスをより管理しやすくするのに役立ちます。
- 専用の TMソフトウェアを使用します。 信頼性の高いTMソフトウェアを使用して、大規模な翻訳データベースを処理してください。 これにより、翻訳の検索、取得、更新することが容易になり、時間の経過とともにTMの変更を追跡することができます。
- カテゴリとラベルを使用します 。 翻訳をカテゴリとラベルに整理して、特定の翻訳を見つけて取得しやすくしましょう。 これは、コンテンツの種類、主題、または翻訳の言語に基づくことができます。
- フィルター を使用します。 フィルターを使用して検索結果を絞り込み、特定の翻訳を見つけるのを容易にします。 これは、ソースまたはターゲット言語、コンテンツの種類、または一致レベルに基づくことができます。
- 検索および置換機能を使用します 。 検索と置換機能を使用して、複数の翻訳を一度に迅速に更新する。 これは、用語やフレーズを複数の翻訳で更新するまたは修正する必要がある場合に役立ちます。
- versioningを使用します 。 バージョニングを使用して、TM への変更を経時的に追跡します。 これは、以前のバージョンの翻訳にロールバックする必要がある場合や、異なるバージョンの翻訳を比較する必要がある場合に便利です。
- 定期的に見直してTMを清掃します。 TMを定期的に見直し、古い翻訳、不正確な翻訳、または重複した翻訳を削除してクリーンアップします。 これにより、TMが時間の経過とともに最新かつ正確に保たれるようになります。
- 翻訳者のチームを使用する : 大規模なTMを管理する際には、TMをレビューし、更新し、維持するのを助けることができる翻訳者のチームを持つことが重要です。 これにより、TMが時間の経過とともに最新かつ正確な状態を保つことができます。
これらの戦略に従うことで、大規模なTMでの翻訳とローカリゼーションのプロジェクトを効果的に管理し、翻訳が正確で一貫性があり、最新の状態であることを保証できます。
翻訳メモリの整合性を維持する方法
これは 翻訳メモリで最も難しいことです。 小さくてドメイン固有な場合は美しく機能し、大きくなりすぎたり、広すぎたり、古くなったりすると、翻訳プロセスを妨げる可能性があります。
ほとんどの translation programs には、セグメントが翻訳メモリに書き込まれるタイミングの明確なパラメーターがありません。 標準的な方法として、翻訳者がセグメントを確認するたびに、それが翻訳メモリに書き込まれます。 これにより、翻訳メモリにも、レビューされなかったか、翻訳メモリツール外で納品後にレビューされた誤った提案が含まれることになります。 これにより 翻訳メモリ の汚染が発生します。
活用を最大化するために、多くのプログラムは単一のフラットな 翻訳メモリ リポジトリを作成することもあります。 これは簡単に設定できますが、汚染の問題を特定して解決できないため、保守するのは大変です。 あなたがTMをコンテンツタイプごとに分けると仮定します。例えば、Web対比。 サポート vs. 法務、部門、またはその他のコンテンツ管理階層によって意味のあるもの。 その場合、これらの各翻訳メモリの作業の健全性を確保するのがはるかに簡単になります。
時々、TMの健康診断を行うことができます。これは、翻訳者によってTMのサンプルを評価し、不一致のタグ付けや誤訳、または言語ペアの問題などの潜在的な問題を特定することによって行われます。 これにより、これらの問題のパターンをマッピングし、それらのパターンを探して解決できます。
ここでの大きな教訓は、大きいほど良いわけではないということです。 人々は「欲張り」になり、TMsをできるだけ大きくして利益を最大化したいと考えますが、TMsはまず第一に品質と一貫性の推進力として見られるべきです。 貯蓄は、それ自体が最終目標ではなく、非常に望ましい副作用であるべきです。
翻訳メモリが100%信頼できない場合の対処法
TMは完璧ではありません。 何一つないですよね、正しいですか?管理ミスは問題につながる可能性があります。 時間が経つにつれて、TMs はさまざまな理由で古いまたは不正確な翻訳によって「汚染」されることがあります。 それらの一つは、1つのTMでコンテンツタイプ(例:法務とマーケティング)を混在させることです。 これは確かに混乱を作成するし、効率を低下させる可能性があります。
ほとんどの 翻訳メモリ は100%信頼できるわけではありません。 これにより、翻訳者が責任を回避し、TMフィードがエラーを引き起こしたと主張できるため、アカウンタビリティの問題が生じます。 信頼できる回避策は、翻訳者が少額の報酬を受け取り、少なくとも100%の一致を再読して全体の文脈をより把握し、潜在的なTMの問題を指摘することを確実にすることです。 全体的な翻訳コストがある割合で増加する一方で、これは翻訳の品質を大きく向上させる要因にもなり得ます。
定期的なクリーンアップは、この問題の解決策です。 TMを定期的に監査し、コンテンツタイプごとに分け、TM環境外での最終編集がデータベースに反映されていることを確認してください。
MTがTMよりも優れているのはいつですか?
これは流動的な問題です。 数年前なら、答えは「絶対にない」だったでしょう。 私たちの研究に基づくと、最近では、マッチ率が80%を超えない限り、MTはTMよりも優れています。 80%以下の一致では、翻訳者はTMまたはMTフィードを部分的から完璧にするために必要な編集距離(労力)が小さくなる可能性が高いです。 Bureau Worksでは、機械翻訳ソフトウェアの出力をより信頼性が高く生産的にするために、MTとTMを信頼度スコア付きの単一のフィードに統合する作業を行っています。
翻訳をTMにコミットする前に自動品質保証(QA)チェックを使用してください
これは重要なベストプラクティスです。翻訳をTMにコミットする前に自動QAチェックを実行することで、汚染や混入を最小限に抑えることができます。 課題の一つは、多くの翻訳者がクラウド管理されていないデスクトップ環境で作業していることであり、これは組織が文がTMに書き込まれるタイミングを細かく制御できない可能性があることを意味します。 代理店が事前に翻訳されたバイリンガルファイル(通常はXLIFF形式)、旧翻訳名、用語集、TMを含むLocKit(ローカライゼーションキット)を送信するのは一般的な慣行です。 彼らは翻訳案件を行い、その後これらのアセットを受け取り、通常はTMの翻訳ユニットをより大きなTMにインポートします。 通常、このプロセスにはチェックとバランスがほとんど関与しません。
TMの外部で行われた変更を含める
これはTM管理のもう一つの大きな問題です。 通常、翻訳管理システムの環境外で行われるコンテンツ編集の最後の部分があります。 弁護士は法律翻訳に変更を加えることができますがマーケティング担当者はコピーに変更を加えることができます。 これらの変更がTMに反映されることはめったになく、将来の翻訳で同じエラーが持続する問題を引き起こし、TMの信頼性が全体的に低下する感覚をもたらします。 この意味では、組織が翻訳者とステークホルダーの間でエンドツーエンドのコラボレーションを可能にし、適切なTM編集環境内で変更が行われることを保証する厳格なガイドラインを施行する、Bureau WorksのようなクラウドベースのTMコンテンツ管理システムと協力することが基本です。
重複エントリ
TM構成における1つの重要な違いは、同じセグメントに対して複数のフィードを許可するかどうかです。 それらを許可すると、翻訳として複数の選択肢を持つ1つのソース文を持つことができます。 これにより、翻訳者が毎回このフィードをレビューして正しい翻訳を選ぶか、最新のタイムスタンプをデフォルトとするようなヒューリスティックなメカニズムを実装することを強制されるでしょう。 また、既存の翻訳または TM セグメントの新しい翻訳を上書きするように TM を設定することもできます。 どちらの道にも長所と短所があります。 私は、少ないほど多く、常に上書きを選ぶべきだと考えています。 ただし、同じセグメントが異なるコンテキストで異なる意味を持つ場合など、これが破綻する例外があります。 それでも、私は例外を個別に処理する方が、ここやそこにあるいくつかの例外を考慮するための全体のメカニズムを作成するよりも好ましいです。 ただし、これはユースケースに敏感であり、最も抵抗の少ないパスを選択することがすべてです。
ペナルティ
ほとんどの TMシステム は、特定のTMにペナルティを設定することを許可します。 ペナルティはそれに応じて試合レベルを下げます。 したがって、1%のペナルティを適用すると、100%の一致が99%の一致にダウングレードされます。 ここでの課題は、私の意見では、翻訳メモリは全か無かの取引のようなものです。 それが信頼できるものであればペナルティはなく、信頼できないものであればペナルティを課しても問題は解決しません。 翻訳者は、TMに含まれる言語コーパスに基づいて文体の決定を行うよう訓練されており、たとえ一致が格下げされても、翻訳者の執筆プロセスに影響を与えることがあります。 ペナルティは最終的にプロジェクトマネージャーが汚染されたTMを救えると信じるための方法です。 それでも、ペナルティを適用するよりもコストがかかるとしても、TMをクリーンアップして維持する方法を見つけるのが最善だと思います。
未来のTM
AIが止まることなく成長するにつれて、TMも成長します。 将来のシステムは、大規模言語モデル(LLM)のような動的データセットと統合して、コンテキストに応じた翻訳を提供できるかもしれません。 TMとAIを活用したMTを組み合わせることで、データベースの維持管理を最小限に抑えながら、TMSが知られる品質を提供し、比類のないスピードと精度を実現できます。
レーベンシュタイン編集距離によって管理される線形マッチは、自然言語処理やその他のモデルを使用して、TMの計算モデルに由来するかどうかに関係なくフィードの品質を推測する動的な信頼スコアに置き換えられる可能性があります。
結論
TMSは、翻訳者が利用できるサイバネティックなスーパー記憶を追加することで、翻訳業界に革命をもたらしました。 これは、特に80年代の大規模な技術文書に関しては、ゲームチェンジャーでした。 突然、人間が提供できない一貫性をテクノロジーに頼ることが可能になりました。 これにより、翻訳ユニットの市場投入までの時間が短縮され、全体的なコスト削減にもつながりました。 多くの点で、TMは業界としてのローカリゼーションの誕生の礎です。
TMは、ほとんどのプロセスと同様に、遠くから見ると見栄えがしますが、実際には良くありません。 管理におけるすべての特性を詳しく調べると、長年にわたるベンダーやコンテンツタイプにわたるTM品質を構築し、管理することは、良いものを取り入れ、悪いものを排除する信頼性のあるTMを構築し、管理することは決して簡単ではありません。 また、ペナルティ、タグ付け、重複処理、例外管理など、TMを適切に管理するために必要なすべてのパラメータに取り組むと、すぐに知識のギャップに直面します。 エンジニアは、技術的な観点からパラメーターを管理するための知識を持っていますが、通常、これらの技術的な決定をビジネス目標に合わせるために必要なビジネスの専門知識が不足しています。 一方、経営幹部は通常、技術的な意味合いを明確にしないままビジネス目標を推進します。 このギャップは通常、TMの誤管理、汚染、汚染、そして全体的な品質と活用の損失を引き起こします。 TMSは一見シンプルに見えますが、決して些細なものではなく、ローカリゼーションプログラムの成功または失敗を決定する上で重要な役割を果たします。
ローカリゼーションコミュニティへの質問
- 時間の経過とともに大規模な翻訳メモリデータベースの正確性と信頼性をどのように確保していますか?
- ワークフローで「翻訳メモリの汚染」を最小限に抑えるためにどのような戦略を使用していますか?
- あなたの経験では、翻訳メモリは創造的またはあまり構造化されていないコンテンツタイプをどのように補完しますか?
- AIを活用したツールを従来の翻訳メモリシステムと統合することについて、どのようにお考えですか?