科技

从一个 TMS 迁移到另一个 TMS 时应该注意什么？

如果您正在考虑更换翻译管理系统，并且有人告诉您“这很简单！只需下载您的 TMX 和 TBX 文件并将它们上传到您的新 TMS 上！- 您很有可能会经历一番波折。切换 TMS 虽然表面上很简单，但打开了痛苦的潘多拉魔盒。

2 min

如果您正在考虑更换TMS（翻译管理系统），而有人告诉您“这很简单！只需下载您的 TMX 和 TBX 文件并将它们上传到您的新 TMS 上！- 您很有可能会经历一番波折。切换 TMS 虽然表面上很简单，但打开了痛苦的潘多拉魔盒。

但在本文中，我们将重点关注在涉及到TMS迁移压力时，我最喜欢的恐惧来源：翻译记忆库的利用和采用。

最大的问题在于翻译记忆库利用。这是行业术语，指的是存储在您的知识库中的句子与新处理的内容相比如何。翻译记忆库可以节省大量成本并提高时间效率。这就是客户愿意积极投资于企业级TMS的原因之一。如果您翻译了“CAT在沙发上。”，现在有新的内容也包含“CAT在沙发上。”，您的TMS将识别出这个句子是完全匹配的，并可能预先确认甚至锁定该内容，这样您就不必再处理它了。

挑战在于TMSs存储的信息远不止您看到的文字。即使是一个简单的DOCX文件也有其自己的编码，并嵌入了用于格式、样式和其他肉眼无法观察到的事项的代码。因此，句子“那只CAT在沙发上。”可能会被存储为“{1}The CAT {1} is on the {2}couch{2}.” 如果是这种情况，并且你重新处理“The CAT is on the couch.”，你可能不会有完美的匹配，但可能会有95%到99%的匹配。

虽然如果您有一个跨多种语言运作的大型内容库，这似乎可以接受，但这种利用行为的变化可能导致数十万段落需要在几十种语言中重新处理，这将对支付费用的人产生负面影响。那么在这种情况下该怎么办呢？鉴于此，在迁移之前，请确保您已广泛测试翻译记忆库，涵盖各种内容库和文件类型，以建立利用的基准预期。这将使您能够在完全致力于迁移之前解决任何潜在问题，并且无法再回头。如果我的基准未按预期执行，该怎么办？

如果您的基准未按预期执行，第一步是寻找杠杆损失的根本原因。要么它将驻留在您的翻译记忆库中，包含您旧版TMS解析和分段策略的印记，要么驻留在您的新TMS的解析和分段策略中。

在我们进一步讨论之前，让我们定义解析和分割。

解析

解析是任何给定系统如何分解输入到其中的数据。例如，在口语中解析是我们的耳朵如何区分声音以理解单独的单词。在本地化中，解析是指TMS遵循的规则，以将源内容分解为可翻译的内容。这包括例如：TMS如何记录格式，如何记录变量，以及如何将代码与可翻译内容分开。

分段

分段仅指构成句子的内容。一个句子是由某些标点符号定义的吗？换行符会导致新句子吗？这些不同的规则也将允许不同的杠杆作用。如果您在旧版 TMS 中翻译了一个 PPTX 文件，其中几个句子环绕在文本框周围，并且您的 TMS 将这些换行符理解为断句符，而您的新 TMS 不再将换行符视为断句符，您将失去该特定句子的杠杆作用。例如，换行符损失可能比解析损失更为严重，因为句子可能变得完全无法识别。对此您能做些什么呢？幸运的是，您可以使用几种不同的方法处理这些问题：

蛮力方法

在这种方法中，您只需咬紧牙关，承认 TMS 迁移是混乱的，并且预计会有一些损失。您只需接受杠杆作用的损失，并理解在开始时翻译会变得更加昂贵和耗时，但一旦您的内容库大部分调整到新的现实，这种情况很快就会趋于平稳并恢复到以前的水平。这种方法特别适用于小型程序（Program Size = 内容 Base Size x Languages），但如果您正在操作较大型程序，则会产生一些严重的预算问题。

翻译记忆库方法

在这种方法中，您可以让 TMS 工程师分析翻译记忆库中的编码模式，并寻找机会应用基于规则的脚本，将这些模式转换为更符合您未来 TMS 标准的模式。假设您的 TM 中有“{1} The CAT {1} is on the {2}couch{2}.”，但您的新 TMS 忽略了标签 {2}，并仅将其记录为“{1} The CAT {1} is the couch.”。通过对 TM 进行寻址，您将运行一个脚本，该脚本了解在哪些条件下引入了 {2} 标记，如果您确信可以删除该 {2} 而不会产生进一步的影响，则可以运行该脚本。您可以进行迭代工作和测试，直到达到一个点，在这个点上您会看到边际收益递减，并且进一步进行翻译记忆库优化工作在经济上不再合理。这种方法适用于各种规模的程序，但它确实引入了以意想不到的方式从根本上改变 TM 的可能性，这可能会导致不希望的后果，最重要的是不可预见的后果。

新的解析和分段策略方法

在这种方法中，您可以解决未来的TMS如何解析和分段内容，并调整这些规则，使其更接近您的翻译记忆库。因此，在与上述相同的示例中，您应确保未来的 TMS 在给定的编码情况下也引入标签 {2}，而不是清理标签 {2} 的 TM，以最大限度地利用。

这种方法是最具动态性的，因为您保持翻译记忆库不变，并且可以针对每种内容类型采取量身定制的方法。因此，例如，您可以为 YAML 和 DOCX 文件使用不同的解析策略，这将为您提供最大的灵活性和可预测性。这种方法的挑战在于，实施起来通常更复杂，而且并非所有 TMS 都能为您提供必要的解析和分段策略灵活性。

结论

迁移 TMS 不是在公园里散步。这更像是一次穿越秘鲁亚马逊，向上攀登安第斯山脉的复杂跋涉。尽早标记和解决潜在复杂性很重要，就像本地化中的任何事情一样，事情会迅速激增并呈指数级增长。确保您真正对您的 TMS 进行压力测试，以便您确切地知道自己要做什么，并从一开始就制定优化策略。

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Gabriel Fairman

Founder and CEO of Bureau Works, Gabriel Fairman is the father of three and a technologist at heart. Raised in a family that spoke three languages and having picked up another three over the course of his life, he has always been fascinated with the role language plays in identity and the creation of meaning. Gabriel loves to cook, play the guitar, tennis, soccer, and ski. As far as work goes, he enjoys being at the forefront of innovation and mobilizing people and teams together toward a mission. In recognition of his outstanding contributions, Gabriel was honored with the 2023 Innovator of the Year Award at LocWorld Silicon Valley.