科技

什么是翻译记忆库软件

翻译记忆库 (TM) 软件是一种计算机辅助翻译 (CAT) 工具,它将翻译的短语和句子存储在一个称为翻译记忆库的数据库中。
Stefan M.
6 min
Table of Contents

翻译记忆库软件: 您需要了解的一切

什么是翻译记忆库软件?

翻译记忆库 (TM) 软件 是一种 计算机辅助翻译 (CAT) 工具 ,它将翻译的短语和句子存储在一个称为 翻译使用或翻译记忆库数据库*的数据库中。 此数据库随后可以用于在未来的翻译中自动匹配和预翻译相似的短语,这有助于提高翻译过程中的一致性和效率。翻译翻译记忆库数据库软件还可以跟踪随时间的变化和修订,并在处理同一文档或项目时共享信息。

翻译记忆库永远不会过时,或者至少不应该过时。 在您选择、翻译、编辑和保存的过程中,TM不断增长和学习。它识别过去翻译中的不同百分比匹配,从而提高一致性并加速工作流。 它帮助您确保项目之间以及每个特定最终客户的术语一致性。

TM 系统是大型项目和重复翻译工作的最佳伙伴。 借助 TM 系统,您可以为首次完成的日常翻译任务添加更新。

它是如何工作的?

翻译记忆库软件 将源文本文件(要翻译的文本)分解为段落,通常是句子或短语。 每个片段随后与翻译记忆库数据库中的片段进行比较,以查看是否有匹配。 如果找到匹配项,则数据库中的相应翻译会自动插入到目标文本中(源文本的翻译版本)。

如果没有匹配项,译员会创建一个新的匹配,然后将其添加到 TM 中以备将来使用。 该软件在使用过程中不断学习,这使其成为处理具有重复内容的项目的唯一选择。 也就是说,人工审核仍然具有相关性,因为如果上下文发生变化或存在微妙之处,即使是完美的匹配也可能错过目标。

该软件通常使用称为“模糊匹配”的过程来查找匹配项,这意味着它可以识别相似的片段,但不完全相同。 这很有用,因为即使在措辞或格式上有细微差异,只要源文本和上下文中的片段与 翻译记忆库

匹配,仍然可以找到匹配项来源: Redokun

当一个片段在 翻译记忆库中没有匹配时,翻译软件会将其标记为“未翻译”,以便译者可以使用翻译记忆库提供新的翻译。

 软件 还允许将新的翻译存储在 翻译记忆库中。 这样,新的翻译可以在未来的翻译中重复使用,从而提高翻译过程的效率和一致性。

总体而言,翻译记忆库软件可以是一个有价值的工具,适用于自由译者、翻译机构和其他经常翻译大量文本的组织。

它是什么时候发明的?

翻译记忆库软件 最早在20世纪80年代开发。 第一个商业翻译记忆库系统被称为“Metatex”,由“Star”公司开发,并于1989年发布。 翻译记忆库技术的概念是基于将以前的翻译存储在一个数据库中,并在将来具有相似短语或句子的项目中重复使用,这有助于提高翻译过程中的一致性和效率。

自从推出第一代 TM 系统以来,该技术不断发展和改进,随着时间的推移,新的特性和功能不断增加。 例如,许多现代翻译记忆库系统现在包括先进的模糊匹配算法、对文件格式的支持,以及与其他CAT工具和机器翻译系统集成的能力。如今,翻译记忆库软件在行业中被广泛使用,作为翻译记忆库的标准工具,帮助提高翻译过程中的效率、一致性和节省成本。 为什么这很重要?

2025年最佳翻译记忆库软件

SDL Trados - 行业内使用最广泛的翻译记忆库软件。 诞生于 Trados 与 SDL 的融合。

MemoQ - 深受翻译人员喜爱,MemoQ 拥有出色的 translation editor UI

Phrase - 原名 Memsource,是最早的云优先 翻译管理系统之一。 在 Memsource 收购 Phrase 后重命名了 Phrase。 支持基于文件和基于字符串的本地化。

__wf_reserved_inherit

Bureau Works - 最初是作为企业专用的 翻译管理、质量管理和业务管理系统,Bureau Works 汇集了管理小型到 大型本地化 用例所需的所有方面,涵盖从报价到支付自动化的所有内容。

Crowdin - 使用 Crowdin 作为您的软件本地化工具,关键优势在于其与600+工具的集成,实现无缝的内容翻译体验。 您可以在一个中心位置统一管理多语言内容,并通过自动化流程提高生产力。

Smartling - 最受欢迎的企业翻译管理系统之一,专注于Web-Proxy翻译并提供服务。

Transifex - 最初在开源社区中很有名,Transifex 被开发人员广泛采用,并且还提供 Web-Proxy 解决方案。

翻译记忆库, 术语表, 和风格指南

虽然翻译记忆库本身已经很强大,但当与术语表和风格指南结合时,它变得难以击败。 词汇表确保行业特定术语的翻译一致,而风格指南则为语气、语法和格式以及最终客户偏好设定规则。

翻译记忆库 (TM)Glossary, and Style Guides 是用于提高翻译一致性和 质量的工具。 但是,每一个都有不同的用途:

  • 翻译记忆库 (TM) 是一个包含先前翻译过的短语和句子的数据库,可以在未来的翻译中自动匹配和预翻译相似的短语。 TM 的主要目的是提高翻译流程的一致性和效率。
  • 词汇表 是特定于特定主题或行业的术语及其翻译的列表。 它有助于确保在整个翻译过程中使用特定术语的一致性。 词汇表还可以帮助确保翻译准确且适合上下文。
  • Style Guides 是提供以特定语言或特定受众编写文本和设置文本格式的准则和规则的文档。 它们可以帮助确保语法、标点符号、格式和其他特定于语言的约定的一致性。

总之,虽然 翻译记忆库和术语表 主要关注翻译的一致性和准确性, 风格指南 主要关注文本的一致性和清晰性。 他们共同努力提高 翻译质量 并确保翻译文本的一致性并适合目标语言和受众。

翻译记忆库 vs. 机器翻译: 它们有何不同?

源: 机器翻译

TM 和 MT 就像苹果和橙子一样,它们可以完成不同的任务,但可以完美地协同工作。

翻译记忆库 (TM) 和 机器翻译 (MT) 是可以用来翻译文本的工具,但它们的工作方式不同,并且各有优缺点。

翻译记忆库 (TM) 是一个包含先前翻译过的短语和句子的数据库,可以在未来的翻译中自动匹配和预翻译相似的短语。 TM 的主要目的是提高翻译流程的一致性和效率。 它主要用于重复和相似的内容,是一个主要供人工翻译人员使用的工具,以帮助他们的工作。

另一方面, 机器翻译 (MT)使用算法和神经网络自动将文本从一种语言翻译成另一种语言。 MT 的主要优点是它可以快速翻译大量文本并处理多种语言。 但是,MT 生成的翻译质量可能会有很大差异,具体取决于文本的复杂程度和用于训练 MT 系统的训练数据的质量。 它也缺乏人工翻译所具有的文化和习语理解。

总之,翻译记忆库(TM)主要用于重复和相似的内容,人工翻译人员主要使用它来辅助他们的工作。机器翻译(MT)主要用于大量文本,并且可以处理多种语言。 尽管如此,它的质量可能会因文本的复杂程度和训练数据的质量而有很大差异。 它们都可以在翻译流程中一起使用,其中 TM 用于增强 MT 输出,使其翻译更准确、更一致。

最好的方法是什么?将它们合并。 您可以使用 MT 来提高速度,然后让 TM 润色输出以获得更精细的结果。

我应该什么时候使用翻译记忆库?

翻译记忆库一直是专业翻译工作流的潘多拉魔盒。 一开始,我们译员对这种新奇事物感到既幸运又受困。 尽管如此,我们及时了解到,通过重复使用过去的翻译,可以消除重新翻译重复内容的需要。 这为我们节省了时间和金钱。 它对保持一致性有很大帮助,并且在截止日期紧迫时(显然,99% 的时间)它是救命稻草。

使用 TM 的一些特定情况可能是有益的:

当您需要翻译大量相似或相同的内容时,例如,假设您有一个网站、双语数据库或产品目录需要翻译成多种语言。 在这种情况下,TM 可以通过重复使用之前翻译的内容来帮助确保一致性和效率。

当您需要翻译同一文档的多个版本时;例如,如果您的用户手册需要经常更新,TM 可以通过重用以前版本的手册中的现有翻译来帮助确保一致性。

当您需要翻译经常更新的内容时;例如,如果您有一个新闻网站或一个经常更新的博客,翻译记忆库可以通过重复使用以前翻译文章中的翻译来帮助确保一致性和效率。

当您需要在同一个项目上与多个翻译人员合作时,TM 可以通过允许翻译人员查看和重用其他团队成员的翻译来帮助确保一致性。

总体而言,翻译记忆库软件可以成为翻译人员、翻译机构和其他经常翻译大量文本并需要在多个翻译中保持一致性和效率的组织的宝贵工具。

Bureau Works TM

创意文本不是翻译记忆库的最佳匹配,但…

创意文本,例如文学、诗歌或广告文案,并不是翻译记忆库 (TM)的最佳匹配,因为它们通常包含高度的创造性、比喻语言和习语表达,这些都不能通过简单的逐字翻译

轻松翻译

此外,创意文本通常具有独特的风格和语调,这在翻译记忆库中很难捕捉。 例如,创意文本可能会使用隐喻、双关语和其他难以一致和准确翻译的文学手段。

然而,即使在处理创意文本时,TM 仍然可以用于提高翻译过程的一致性和效率。 一种方法是使用 TM 来存储文本中使用的常用短语、相同单词和句子的翻译。 这有助于确保 术语 和措辞在整个翻译 文本的一致性。 例如,对于这些文本中经常出现的口号或免责声明来说,情况就是如此。

也可以使用 TM 预先翻译某些文本片段,然后进行 专业翻译审查 并编辑翻译,以确保它们准确且适合语言专业人士的当前上下文。

总体而言,虽然创意文本可能不是 TM 的最佳选择,但它们仍可用于提高翻译 过程中的一致性和效率。 尽管如此,将其与 人工翻译 和编辑结合使用对于确保最佳结果非常重要。

不同类型的重复内容可以从翻译记忆库工具中受益

有许多类型的重复内容可以通过使用翻译记忆库(TM)工具受益。 以下是一些示例:

技术文档

技术手册、用户指南和其他类型的技术文档通常包含高度重复,在整个文本中使用了许多类似的短语和句子。 TM 可以帮助确保翻译这些类型文档的一致性和效率。

软件和网站本地化

网站和软件应用程序 通常包含高度重复,例如菜单项、错误消息以及在整个界面中重复使用的其他文本类型。 TM可以帮助确保这些类型项目的本地化过程中的一致性和效率。

营销和广告材料

宣传册、广告文案和其他营销材料通常包含高度重复的内容,例如在整个材料中重复使用的口号、产品名称和其他类型的文本。 TM 可以帮助确保翻译这些类型文档的一致性和效率。

法律文档

法律文档(如合同、协议和法律形式)通常包含高度重复,例如在整个文档中重复使用的法律术语和短语。 TM 可以帮助确保翻译这些类型文档的一致性和效率。

医学和科学文档

医学和科学文档 通常包含高度重复,例如在整个文档中重复使用的技术术语和短语。 TM 可以帮助确保翻译这些类型文档的一致性和效率。

总之,任何具有重复段落的内容,无论是文本、短语还是句子,都可以通过使用翻译记忆库 (TM)工具受益,因为它将有助于确保翻译过程中的一致性和效率,同时节省时间和成本。

翻译记忆库的好处是什么?

翻译记忆库 允许您:

  • 不再重复翻译相同的句子
  • 通过不再翻译相同的内容节省资金
  • 通过不将其计为可翻译内容并减少周转时间来节省时间
  • 提高一致性,因为它参考了过去的翻译
  • 识别相似的句子结构
  • 通过提供部分翻译的句子节省资金,翻译人员只需“填空”即可
  • 通过提供部分翻译的句子节省时间
  • 通过参考过去的相似翻译提高一致性

法律和财务文本应用

法律

  1. 合同翻译: TM 技术可用于翻译法律合同和协议,确保所有翻译一致、准确和最新。 重复使用 TM 数据库中以前翻译的句段有助于减少翻译新合同所需的时间和资源,同时还可以提高翻译的一致性和准确性。
  2. 法律术语: 法律文本通常包含特定于法律领域的专业术语和短语。 TM 技术可以通过在 TM 数据库中存储和重复使用这些术语来帮助确保使用这些术语的一致性。 这有助于确保所有法律翻译的一致性和准确性,同时降低出现错误和不一致的风险。
  3. 诉讼支持: TM 技术可以通过提供一个法律团队可以轻松访问的集中翻译数据库来支持诉讼。 这在多语言诉讼中尤其有帮助,其中关键文件和证据的翻译至关重要。 通过利用翻译记忆技术的优势,法律团队可以快速检索相关翻译,并确保其准确且最新。

财务

  1. 财务报告 TM 技术 可用于 翻译财务报告,确保所有翻译的一致性、准确性和时效性。 从 TM 数据库中重用以前翻译的句段有助于减少翻译新报告所需的时间和资源,同时还可以提高翻译的一致性和准确性。
  2. 金融术语: 金融文本通常包含特定于金融行业的专业术语和短语。 TM 技术可以通过在 TM 数据库中存储和重复使用这些术语来帮助确保使用这些术语的一致性。 这有助于确保所有 金融翻译 一致且准确,同时降低出错和不一致的风险。
  3. 法规遵从性: 在金融行业,遵守法规至关重要。 TM 技术可以通过提供易于审查和更新的集中式翻译数据库来帮助确保翻译符合法规。 这有助于确保所有 金融翻译 都是准确和最新的,同时降低出错和不一致的风险。

技术文档和产品手册

  1. 用户手册: 技术产品的用户手册通常包含详细的说明和规范。 TM 技术 可以通过在 TM 数据库中存储和重复使用以前翻译的句段,帮助确保所有手册翻译的一致性、准确性和时效性。 这有助于确保用户可以访问多种语言的准确且一致的用户手册。
  2. 技术规格: 产品的技术规范通常包含有关产品特性、功能和性能的详细信息。 TM 技术 可以通过在 TM 数据库中存储和重复使用以前翻译的句段来帮助确保所有技术规范翻译的一致性、准确性和时效性。 这有助于确保所有利益相关者,包括工程师、技术人员和销售团队,能够获取多种语言的准确且一致的技术规格。
  3. 软件本地化: 软件产品的技术文档 通常包括用户界面、帮助文件和发行说明。 TM 技术可以通过在 TM 数据库中存储和重复使用以前翻译的片段,帮助确保软件技术文档的所有翻译都是一致、准确和最新的。 这有助于确保软件用户可以访问多种语言的准确且一致的软件文档。

完全匹配和模糊匹配

 翻译记忆库 (TM)软件的上下文中,“完全匹配”和“模糊匹配”指的是源文本片段(要翻译的文本)与 翻译记忆库数据库

中的片段之间的相似程度。“完全匹配”发生在源文本片段与 翻译记忆库数据库 中的片段完全一致时(包括文本周围的所有格式和代码)。 此完全匹配意味着两个区段的措辞、格式和上下文相同。 完全匹配被认为是最高质量的匹配,因为翻译记忆库交换可以自动插入到相同的目标文本文件中,并且可以高度确信其正确性。

当源文本片段与翻译记忆库数据库中的片段相似但不完全相同时,就会出现“模糊匹配”。 这意味着这两个段落的措辞、格式或上下文可能不同,但整体意义相同。 模糊匹配被认为是比完美或相同匹配质量较低的匹配,因为翻译记忆库的工作可能需要审查和调整,以确保其适合当前的上下文。 该软件通常使用百分比匹配分数来表示源文本与数据库中句段之间的相似程度。

总之,完美匹配是文本源和 TM 中句段的完全匹配,而模糊匹配是相似但不完全相同的匹配。 完美匹配被认为是最高质量的匹配。 可以高置信度自动插入翻译。 相反,模糊匹配被视为质量较低的匹配,可能需要在插入翻译之前进行审核。

使用翻译记忆库的一些最佳实践是什么?

以下是使用翻译记忆库(TM)以提高翻译一致性和效率的一些最佳实践:

  1. 首先创建高质量的 TM: 在开始使用TM之前,确保您拥有一个高质量的翻译记忆库,其中包含准确且适当的翻译,这是至关重要的。 这可以通过从以前翻译的内容创建一个TM,或者让a专业翻译人员review并编辑TM来完成。
  2. 使用 一致的术语: 为了确保翻译的一致性,在整个 TM 中使用一致的术语非常重要。 这可以通过创建术语及其翻译的词汇表,并使用它预先翻译 TM 中的类似短语和句子来实现。
  3. 定期更新和维护您的 TM: 随着您继续翻译新内容,定期更新和维护您的TM非常重要,通过添加新翻译和删除过时或不正确的翻译来实现。 这将有助于确保您的 TM 随着时间的推移保持最新和准确。
  4. 将翻译记忆库与其他工具结合使用:翻译记忆库软件在与术语表和风格指南等其他工具结合使用时效果最佳。 他们可以帮助确保翻译的一致性和准确性。
  5. 使用适当的 TM 匹配级别: 翻译记忆库软件 允许您为每个段设置匹配级别。 为每个句段使用适当的匹配级别对于确保您使用最合适的翻译非常重要。 例如,对之前翻译过的内容使用完全匹配,对相似但不完全相同的片段使用模糊匹配。
  6. 查看和编辑翻译: 始终查看和编辑 TM 生成的翻译,以确保它们准确且适合当前上下文。
  7. 用您的特定内容训练您的TM: 如果您正在处理特定领域或行业,重要的是用特定的内容和术语来训练您的TM,以提高翻译的准确性和一致性。

通过这些实践,您的 TM 将始终是任何项目中可靠且强大的工具,无论最终客户、风格、类型和行业如何。

在翻译之前注意源文本,以便最大限度地利用翻译记忆库

有几种方法可以优化源语言内容,以最大化使用 翻译记忆库 (TM) 工具:

  1. 使用 一致的术语: 为了确保翻译的一致性,在源语言内容中使用一致的术语是很重要的。 这可以通过创建术语及其翻译的词汇表来实现,并使用它来预翻译源语言内容中相似的短语和句子。
  2. 使用 一致的格式: 源语言内容的一致格式可以帮助TM更轻松地识别和匹配段落。 例如,使用相同的标点符号、大小写和间距可以帮助 TM 更准确地识别和匹配类似的句段。
  3. 使用 一致的结构: 在源语言内容中保持一致的结构也可以帮助TM更容易地识别和匹配片段。 例如,使用相同的标题、项目符号和编号列表可以帮助 TM 更准确地识别和匹配类似的句段。
  4. 使用 一致的上下文: 源语言内容的一致上下文也可以帮助TM更容易地识别和匹配片段。 例如,如果您翻译用户手册并使用特定步骤的确切说明,TM 将能够更轻松地匹配这些说明。
  5. 避免 惯用语: 惯用表达很难翻译,而且通常与 TM 不匹配;避免使用它们或谨慎使用它们是最好的。
  6. 使用 占位符: 可以在源语言内容中使用占位符来表示变量,例如日期、数字和名称。 这可以帮助确保这些变量在翻译中的一致性,即使它们在源语言内容中发生变化。

通过遵循这些最佳实践,您可以优化您的源语言内容,以最大化使用您的TM并提高翻译的一致性和效率。

可以重写以最大化翻译记忆库利用率的句子示例:

以下是 10 个写法不同但可以重写为彼此相同的句子示例:

  1. "CAT坐在垫子上" 和 "猫科动物躺在地毯上。"
  2. "我将在公园见你," 和 "我们将在绿地会合。"
  3. "我有一辆红色的车," 和 "我拥有一辆红色的车辆。"
  4. "请给我那本书" 和 "请提供我那本书籍。"
  5. "我去商店," 和 "我前往商店。"
  6. "他是一个高个子男人" 和 "他身材高大。"
  7. "狗大声叫," 和 "犬发出很大的声音。"
  8. "我稍后会打电话给你," 和 "我随后会与你联系方式。"
  9. "我很高兴" 和 "我处于快乐的状态。"
  10. "食物很美味," 和 "菜肴令人愉悦。"

这些句子在结构或措辞上可能听起来不同,但仍然传达相同的信息。 一个 翻译记忆库系统 可以匹配这些句子并提供相同的翻译,确保整个文本的一致性。

如何创建高质量的翻译记忆库?

创建一个高质量的翻译记忆库(TM)对于确保翻译的一致性和效率至关重要。 以下是创建高质量 TM 可以采取的一些步骤:

  1. 从零开始: 在创建 TM 之前,必须从头开始,从数据库中删除过时或不准确的翻译。
  2. 收集和组织您的源内容: 收集您想要包含在您的 TM 中的所有源内容,并组织它以便于查找和参考。 这可以是电子表格、数据库或文档管理系统的形式。
  3. 使用 一致的术语: 为了确保翻译的一致性,在整个源内容中使用一致的术语是很重要的。 这可以通过创建术语和其翻译的词汇表来实现,并使用它来预翻译源内容中相似的短语和句子。
  4. 翻译您的源内容: 使用专业翻译人员翻译您的源内容。 确保翻译人员在您的行业和主题方面经验丰富。
  5. 查看和编辑翻译: 请专业翻译人员审查它们,以确保其准确且适合当前语境。
  6. 将您的翻译存储在 TM 中: 一旦它们经过审查和编辑,请将它们存储在您的TM中,以便于查找和参考。
  7. 使 TM 保持最新: 随着您继续翻译新内容,定期更新和维护您的TM非常重要,通过添加新翻译和删除过时或不正确的翻译来实现。
  8. 领域特定内容: 如果您正在处理特定领域或领域,请为该领域使用单个 TM,不要将其与其他领域混合使用。

如何管理庞大的翻译记忆库

管理大型 翻译记忆库 (TM)可能具有挑战性,但有几种策略可以帮助使过程更易于管理:

  1. 使用专用 TM 软件: 使用可靠的 TM 软件来处理大型翻译数据库。 这将使搜索、检索和更新翻译变得更加容易,并跟踪 TM 随时间的变化。
  2. 使用 类别和标签: 将您的翻译组织成类别和标签,以便更轻松地查找和检索特定翻译。 这可以基于内容的类型、主题或翻译的语言。
  3. 使用 过滤器: 使用过滤器缩小搜索结果范围,并使查找特定翻译变得更容易。 这可以基于源语言或目标语言、内容类型或匹配级别。
  4. 使用 搜索和替换功能: 使用搜索和替换功能一次快速更新多个翻译。 当一个术语或短语需要在多个翻译中更新或更正时,这可能很有用。
  5. 使用 版本控制: 使用版本控制来跟踪 TM 随时间的变化。 当您需要回滚到翻译的早期版本或需要比较翻译的不同版本时,这可能很有用。
  6. 定期检查和清理 TM: 定期检查和清理 TM,删除过时、不准确或重复的翻译。 这将有助于确保您的 TM 随着时间的推移保持最新和准确。
  7. 使用一个 团队的翻译人员: 在管理大型TM时,拥有一个能够帮助审查、更新和维护TM的团队的译者是很重要的。 这将有助于确保 TM 随着时间的推移保持最新和准确。

通过遵循这些策略,您可以有效地管理大型 TM 上的翻译和本地化项目,并确保您的翻译准确、一致且最新。

如何维护翻译记忆库的完整性

这是在 翻译记忆库中最难的事情。 当它们较小且特定于领域时,它们可以很好地工作,而当它们变得太大、太宽或太旧时,它们可能会阻碍翻译过程。

大多数 translation programs 没有明确的参数来决定何时将一个片段写入翻译记忆库。 标准做法是,每次翻译人员确认一个片段时,它都会被写入到 翻译记忆库。 这导致翻译记忆库中也包含了从未审核或在交付后在翻译记忆库工具之外审核的错误建议。 这导致了 翻译记忆库 污染。

为了最大化杠杆作用,许多程序还将创建一个单一的平面 翻译记忆库 存储库。 虽然这很容易设置,但维护起来很糟糕,因为您无法隔离和解决污染问题。 假设您按内容类型(例如 Web)对 TM 进行分类,例如 Web 与。 支持 vs. 法律,或按部门或任何其他内容管理层次结构合理的内容。 在这种情况下,确保每个翻译记忆库的运行状况会容易得多。

您可以通过让译员评估翻译记忆库的样本来偶尔进行翻译记忆库的健康检查,找出潜在的问题,例如不一致的标记或错误的翻译,甚至是语言对。 这使您能够绘制这些问题的模式,然后查找并解决这些模式。

这里最大的教训是,更大并不意味着更好。 人们变得“贪婪”,并希望通过尽可能扩大 TM 来最大化回报,但 TM 首先应该被视为质量和一致性的驱动力。 储蓄应该是一个非常理想的副作用,而不是最终目标本身。

如果翻译记忆库不是100%可靠,该怎么办

TM并不完美。 没有一件事情是,正确吗?管理不善会导致问题。 随着时间的推移,由于许多不同的原因,TM 可能会因过时或不准确的翻译而“污染”。 其中之一是将内容类型(例如,法律和营销)混合在一个 TM 中。 这肯定会造成混乱并降低效率。

大多数 翻译记忆库 并不是 100% 可靠的。 这就产生了一个问责问题,因为翻译人员可以撇清责任,声称是翻译记忆动态引入了错误。 一个可靠的解决方法是确保翻译人员获得较少的报酬,至少重新阅读 100% 的匹配项,以获得更全面的上下文并标记潜在的 TM 问题。 虽然这将使总体翻译成本增加一定程度,但它也可能是一个重要的翻译质量驱动因素。

定期清理是解决此问题的方法。 确保定期审核您的TM,按内容类型进行分离,并验证在TM环境之外的任何最终编辑都已反映在数据库中。

MT 什么时候比 TM 好?

这是一个不断变化的问题。 几年前,答案是绝对的“绝不”。 如今,根据我们的研究,除非您的匹配率超过 80%,否则 MT 优于 TM。 在低于80%的匹配度时,翻译人员更有可能需要较小的编辑距离(将翻译记忆或机器翻译动态从部分到完美所需的努力)。 在Bureau Works,我们正在努力将MT和TM统一到一个带有置信度评分的动态中,以提高机器翻译软件输出的可靠性和生产力。

在将翻译提交到 TM 之前使用自动质量保证(QA)检查

这是一个重要的最佳实践,因为在将翻译提交到 TM 之前运行自动 QA 检查 可以最大限度地减少污染和污染。 挑战之一是许多翻译人员仍在不受云控制的桌面实例中工作,这意味着组织可能无法精细控制句子何时写入 TM。 通常的做法是,代理机构会发送一个 LocKit(本地化工具包),其中包含预翻译的双语文件(通常为 XLIFF 格式)、旧翻译名称、词汇表和 TM。 他们将完成翻译工作,然后收回这些资产,通常将翻译记忆库的翻译单元导入到更大的翻译记忆库中。 此过程通常很少涉及制衡。

在 TM 中包含在其之外所做的任何更改

这是另一个巨大的 TM 管理 问题。 通常情况下,内容编辑的最后一步是在翻译管理系统环境之外进行的。 律师可能会更改法律翻译,而营销人员可能会更改文案。 这些更改很少会流回 TM 中,从而产生一个问题,即相同的错误可能会在未来的翻译中持续存在,并导致 TM 不可靠的整体感觉。 从这个意义上说,组织与基于云的TM内容管理系统(如Bureau Works)合作是至关重要的,该系统允许翻译人员和利益相关者之间的端到端协作,并强制执行严格的指南,以确保更改在适当的TM编辑环境中进行。

重复条目

一个关键区别在于 TM 配置 是您是否允许同一段有多个动态。 如果你允许它们,你可以有一个源句子和多个替代项作为翻译。 这将迫使您每次都让翻译人员审查此动态以选择正确的翻译,或者实施一种启发式机制,例如默认为最新时间戳。 您还可以将 TM 设置为覆盖现有翻译或 TM 段的任何新翻译。 两条路都有其优点和缺点。 我认为少即是多,并且会在 100% 的情况下选择覆盖。 在一些例外情况下,这种情况会失效,例如同一段在不同的上下文中意味着不同的事物。 尽管如此,我宁愿单独处理异常,也不愿创建一个完整的机制来考虑这里和那里的一些异常。 不过,这与用例敏感有关,并且完全是关于选择阻力最小的路径。

处罚

大多数 TM 系统 允许您为某个 TM 设置处罚。 处罚将相应地降低比赛级别。 因此,如果您应用 1% 的罚款,这将导致 100% 匹配降级为 99% 匹配。 这里的挑战在于,我认为,翻译记忆库是一个全有或全无的交易。 要么它是可靠的,没有附加的惩罚,要么它不可靠,受到惩罚不会解决你的问题。 译员接受过训练,以基于翻译记忆库中的语言语料库来做出风格决策,即使匹配项被降级,它们仍会影响译员的写作过程。 惩罚最终是让项目经理相信他们可以挽救受污染的TM的一种方式。 尽管如此,我认为最好是查找清理和维护 TM 的方法,即使这比对其施加惩罚更昂贵。

未来的 TM

随着 AI 不可阻挡地发展,TM 也将如此。 未来的系统可以与大型语言模型(LLM)等动态数据集集成,以提供上下文感知翻译。 将 TM 与 AI 驱动的 MT 相结合可以带来无与伦比的速度和精度,最大限度地减少数据库维护,同时提供 TM 所知的质量。

由Levenstein编辑距离控制的线性匹配可能会被动态置信度评分所取代,这些评分使用自然语言处理和其他模型来推断动态的质量,而不管它是否源自TM的计算模型。

结论

翻译记忆库(TM)通过添加翻译人员可以利用的控制论超级记忆,彻底改变了翻译行业。 这改变了游戏规则,尤其是在 80 年代大型技术文档中。 突然之间,依靠技术来实现人类无法提供的一致性成为可能。 这也提高了翻译单位的上市时间效率,并节省了总体成本。 在许多方面,TM 是本地化作为一个行业诞生的基石。

与大多数流程一样,TM 从远处看起来不错,但远非良好。 当你深入研究多年来管理 TM质量 的所有细节,包括供应商和内容类型时,构建和管理一个可靠的TM以确保优质内容进入并阻止劣质内容,是一项非常复杂的任务。 当您深入了解正确管理 TM 所需的所有参数(例如处罚、标记、重复处理和异常管理)时,您很快就会遇到知识差距的难题。 工程师将具备从技术角度管理参数的知识,但他们通常缺乏使这些技术决策与业务目标保持一致所需的业务专业知识。 另一方面,高管通常会在不清楚技术影响的情况下推动业务目标。 这种差距通常会导致 TM 管理不善、污染、污染以及质量和杠杆的整体损失。 TM 虽然看起来很简单,但绝非微不足道,它将在决定您的本地化计划成功与否方面发挥关键作用。

面向本地化社区的问题

  1. 您如何确保大型翻译记忆库数据库随着时间的推移保持准确性和可靠性?
  2. 在您的工作流中,您使用哪些策略来最小化“翻译记忆库污染”?
  3. 根据您的经验,翻译记忆如何补充创意或结构较少的内容类型?
  4. 您对将AI驱动的工具与传统翻译记忆库系统集成有什么看法?

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Stefan M.
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support