编辑距离是指相对于原始内容对翻译文本进行修改的百分比。 它衡量译员为达到预期结果而对机器生成的翻译进行多少修改。
例如,如果一个句子中出现 6 个单词,其中 3 个单词被更改、删除或重新排列,则编辑距离为 50%。 该指标是一个有用的指标,用于衡量机器翻译的输出与最终润色翻译的接近程度。
语言对和领域的可变性
编辑距离不仅在不同语言之间有所不同,还根据所翻译的内容类型而变化。 根据一项大规模研究,分析了多个领域的 5000 多万个单词,各种语言对的平均编辑距离记录如下:
- 英语到西班牙语: 5.5%
- 英语到法语: 12.4%
- 英语到丹麦语: 4.5%
- 英语到泰语: 11.8%
这些百分比的范围凸显了不同语言的细微差别。 然而,个人用户行为进一步增加了理解和优化翻译流程的复杂性。
.png)
探索用户行为在翻译中的表现
研究中揭示的最吸引人的方面之一是个别翻译者修改内容的程度差异,无论语言对或领域如何。 例如:
- 一些翻译人员进行了不到 1% 的编辑,这表明他们可能只是确认机器翻译没有进行太多调整。
- 其他人进行了高达 77% 的编辑,重写了原始输出的大部分。
正如我们的首席执行官 Gabriel Fairman 所说:
“您看到的用户是……一头扎进这个 AI 编辑的事情……您还会看到用户几乎是在对抗它,或者否认它,并真正付出全部努力重写大多数句子。”
这种广泛的行为引发了关键问题:
- 较少的编辑是否表明机器输出质量高或人工监督质量差?
- 过多的编辑是否预示着彻底的重写过程或低效的翻译工作?
在编辑和效率之间取得正确的平衡
如今的翻译,特别是结合AI和机器翻译时,需要在编辑次数和整体生产力之间取得微妙的平衡。 翻译人员面临两个主要挑战:
- 编辑太少: 如果错过关键调整,可能会导致不准确。
- 编辑过多: 这可能会导致效率低下、生产力降低和成本增加。

正如我们的首席执行官 Gabriel Fairman 在他的 Edit Distance 相关视频系列中提到的那样:
“你有的用户变化不到 1%,这意味着他们基本上只是在阅读和确认事情...... 然后你有其他翻译人员正在翻译那77%的内容,这几乎是[than average]的13倍多。
关键考虑因素以实现最佳编辑:
- 仅编辑必要的内容: 译者应避免多余的更改,例如将同义词交换(将“平台”换成“系统”)。
- 专注于有影响力的编辑: 关键调整(例如保留专有名词或更正术语)对质量有持久的影响。
生产力 与 翻译中的所有权
另一个挑战在于保持对翻译材料的所有权。 翻译人员必须在他们想要感觉像作者的愿望与高效工作的需求之间取得平衡。 经济现实要求翻译人员快速完成任务,但过多的更改可能会减慢他们的速度并增加出错的可能性。
这种紧张在诸如后期编辑AI输出的任务中变得尤为明显,翻译人员的目标是查找“最佳点”——进行足够的编辑以提高质量,而不降低生产力。 翻译人员如果对非创意内容(如技术文档)进行过多更改,可能会变得无效,进而可能危及他们在行业中的相关性。

定义理想的编辑距离
最终,确定理想的编辑量——或者说“好”的标准——不仅取决于语言对,还取决于用户行为和内容类型。 为了让翻译人员保持竞争力,他们必须学会适应,在速度和准确性之间取得平衡。 过多或过少的编辑都伴随着风险,只有通过查找正确的平衡,他们才能保持生产力和质量。
在后期编辑AI内容的过程中,实现这种最佳平衡的旅程仍在继续,但理解编辑距离的动态为未来的挑战和机遇提供了一个有价值的视角。