翻译记忆库和术语库是惊人的突破……可以追溯到 1970 年代。 那是将近 50 年前的事了,我们仍在使用相同的古老技术。 当然,我们已经改进了匹配算法,引入了自适应机器翻译,但基本范式保持不变。
如果你想翻译,你有两个主要工具:一个翻译记忆库和一个术语表。 与颠覆其他行业的现有技术相比,我们正在以狩猎采集尼安德特人的风格进行翻译。TM 和 TB 本质上没有任何问题。 它们是很棒的工具。
挑战在于它们是文件的静态转储,没有正确考虑语言工作流的动态性质。下面是一个示例。 翻译人员认为应该将术语添加到术语库中。 他们可以向他们正在使用的CAT工具建议这个术语,将其添加到共享电子表格中,或者将此信息传达给项目经理等其他选项。 尽管如此,他们都未能完成一个学期的全部旅程。
以下是 4 个简单的步骤: 出生、翻译、审批和出版。
一个术语需要诞生,无论是从统计还是 AI 挖掘中诞生,并且需要由编辑评估其上下文和相关性。 一旦它被认为值得作为一个术语,它就需要翻译。 不仅仅是任何一种翻译,而是经过充分研究、在上下文中深思熟虑的关键术语翻译。
这些翻译需要流向专家编辑,他需要签署该术语的给定翻译。 一旦完成,该术语就会发布。现在您已经为所有未来的翻译发布了该术语,您如何处理在该术语提升到术语表级别之前管理的整个语言语料库。 假设您将 “pen” 的翻译更改为 “stylograph”。 现在所有的翻译记忆库都需要更新,字符串可能需要重新发布,而这一切都是一个手动、耗时且容易出错的过程。
我们相信术语库是动态实体,可以、将要并且实际上应该随着时间的推移而改变。 人们将术语库视为静态实体的主要原因之一是,管理翻译记忆库和整个工作主体更改的连锁反应非常复杂。
所以由于技术限制,我们变得懒惰和自满。 不断更新数十种语言的数百个术语是一场噩梦情景。 我们不再需要了。 我们的术语管理工具将术语视为活生生的、会呼吸的适应性实体,它们会随着时间的推移而发生变化。 我们的技术专注于跟踪这些工作流,并确保在正确的层级上有正确的人参与,以建议、翻译和批准一个术语。
我们还提供工具,以便比以前更容易在多个翻译记忆库中进行全局更改。然而,真正的愿景是词汇表能够动态地在翻译记忆库中进行交叉引用,标记和修正不一致之处,以确保整个译员语料库的流畅性。
这只是一个小小的例子,说明知识管理是多么薄弱,并阻碍我们在译员管理方面真正发光。 在字符串管理、翻译记忆库和术语管理方面,如果技术专注于根据人们实际工作的方式解决用例,而不仅仅是改进一个已有50年历史的过时功能集,那么可以做得更多。
作者:Gabriel Fairman
Gabriel 是 Bureau Works 的创始人兼首席执行官。 他喜欢变化,喜欢吃草。