最佳实践

什么是 BLEU 分数?

作为一个自动化过程,必须定期评估机器翻译以确保其质量。
Rodrigo Demetrio
2 min
Table of Contents

作为一个自动化过程,机器翻译必须定期评估以确保其质量。

你怎么能做到这一点呢?公司有两种选择。 其中之一是聘请专业人士来审查翻译。

当然,这与整个 MT 流程几乎是矛盾的,因为这是一个不涉及人工的翻译过程。 为了解决这个问题,创建了 BLEU 分数。 BLEU 分数对于熟悉 MT 的人来说是一个众所周知的概念。

BLEU 是 Bilingual Evaluation Understudy 的简称 - 或一种将机器翻译的文本从一种语言评估为另一种语言的算法。

BLEU 分数如何评估质量?

为了评估文本的质量,BLEU 分数会将其与参考翻译进行比较。 换句话说,BLEU 分数衡量自动翻译和专业翻译之间的相似性。 理想情况下,自动化版本越接近人工翻译内容,就越好。 BLEU 分数通过其算法了解文本与参考内容的“接近”程度。

该算法将 MT 文本中的连续句子与参考翻译中的连续句子进行比较,继续评估它们之间的相似程度,而不考虑语法或可理解性。 然后,BLEU 根据此信息提供从 0 到 1 的分数。 理想情况下,1 是这里最好的情况。

然而,需要指出的是,很少有文本会达到这个分数,因为这意味着 MT 文本与参考语料库中的至少一个文本相同。

正如您可能已经注意到的,BLEU 评分系统需要有参考内容来评估机器翻译的文本。 事实上,通常建议在参考翻译中至少收集 1,000 个句子,以确保其质量。

这项技术有一些缺点。 例如,根据翻译内容的性质,大量引用句子可能会成为一个问题。 然而,这种方法在 MT 用户中仍然非常流行,并且是衡量自动翻译文本的最具成本效益的方法之一。

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Rodrigo Demetrio
Passionate about bringing ideas to life and how languages connect people. One dream? Less marketing, more conversations, less algorithm content, and more originality. Let’s make something awesome together!
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support