Die Bearbeitungsentfernung ist eine entscheidende Kennzahl bei der Übersetzung und Lokalisierung, insbesondere in der heutigen KI-gesteuerten Landschaft. Er misst die Anzahl der Änderungen – Hinzufügungen, Streichungen oder Neuanordnungen –, die an einem bestimmten Textvorschlag vorgenommen wurden, um ihn an die gewünschte Übersetzung anzupassen. Dieser Vorschlag, auch "Feed" genannt, kann aus verschiedenen Quellen stammen, einschließlich:
- Maschinelle Übersetzungs-Engines
- Große Sprachmodelle (LLMs)
- Kollegen Übersetzer
Das Ziel ist es, zu verfolgen, wie viel Aufwand erforderlich ist, um vom anfänglichen Feed zur endgültigen, bestätigten Übersetzung zu gelangen.
Berechnung der Bearbeitungsentfernung
Schauen wir uns anhand eines einfachen Beispiels an, wie diese Metrik funktioniert. Angenommen, der Feed sagt, „Gabriel ist zum Markt gegangen.“ Ein Übersetzer bearbeitet es zu: "Gabriel ging auf den Markt." So würde die Berechnung aussehen:
- Löschungen: "hat" und "gegangen" (2 Bearbeitungen)
- Ergänzungen: "ging" (1 Bearbeitung)
- Bearbeitungen insgesamt: 3
- Ursprüngliche Satzlänge: 6 Wörter
- Distanz in Prozent bearbeiten: 3 ÷ 6 = 50%
Diese Berechnung hilft, den Aufwand des Übersetzers zu quantifizieren. In einigen Fällen können Änderungen 100 % überschreiten, wenn ein gesamt neuer Satz erstellt wird, was die Frage aufwirft, ob der Prozentsatz begrenzt oder es erlaubt werden soll, das gesamte Ausmaß der Modifikationen widerzuspiegeln.
Gabriel Fairman erklärt in seiner Videoserie "Edit Distance":
"Edit-Distanz ist typischerweise die Anzahl der Bearbeitungen, die an einem bestimmten Vorschlag vorgenommen werden, oder was man als Feed bezeichnet, den ein Übersetzer erhält, und die Übersetzung, die der Übersetzer bestätigt"

Warum Edit-Distanz wichtig ist
In einer Ära, in der Übersetzungs-Tools stark auf KI angewiesen sind, bietet die Edit-Distanz Einblick in die Effizienz und Qualität dieser Tools. Es bietet mehrere Vorteile:
- Bewertung von Feed Qualität: Verfolgt, wie viel Arbeit erforderlich ist, um maschinell generierten Inhalt zu verbessern.
- Bewertung des Übersetzeraufwands: Misst, wie viel manuelle Eingabe erforderlich ist, um Übersetzungen akzeptabel zu machen.
- Vergleich verschiedener Sprachen oder Inhalt-Typen: Zeigt Muster auf, wie viel Bearbeitung spezifische Arten von Inhalt über verschiedene Sprachen hinweg erfordern.
Zusammen mit Bearbeitungszeit bietet die Bearbeitungsdistanz eine skalierbare Möglichkeit, die Produktivität und Qualität von Übersetzungsarbeitsabläufen zu messen.
Herausforderungen und zukünftige Auswirkungen
Die Edit-Distanz ist zwar nützlich, hat aber auch Grenzen. Wenn sich KI-generierte Übersetzungen verbessern, sind möglicherweise weniger Bearbeitungen erforderlich. Diese Verschiebung wirft Fragen auf:
- Ist ein geringerer Bearbeitungsabstand immer besser? Nicht unbedingt – einige sehr nuancierte Übersetzungen können immer noch erhebliche Änderungen erfordern.
- Sollten Prozentsätze über 100 % normalisiert werden? Wenn größere Umschreibungen häufig vorkommen, kann eine Begrenzung der Prozentsätze auf 100 % die Durchschnittswerte verzerren.
- Welche anderen Metriken sollten die Bearbeitungsdistanz ergänzen? Das Ausbalancieren der Bearbeitungsdistanz mit Maßnahmen der Ausgabequalität und des Übersetzerverhaltens wird der Schlüssel sein.

Im Zuge der Weiterentwicklung der Branche wird die Bearbeitungsdistanz ein wesentliches Instrument zur Analyse der Übersetzungseffizienz bleiben, aber ihre Rolle wird sich mit den Fortschritten in der KI verändern. Laut unserem CEO, Gabriel Fairman:
"Da der Inhalt von großen Sprachmodellen und maschinellen Übersetzungsmaschinen immer besser wird, bewegen wir uns in eine Richtung, in der wir immer weniger Bearbeitungen sehen, um von maschinellen zu menschlichen Übersetzungen zu gelangen."
Die Bearbeitungsdistanz ist eine grundlegende Kennzahl für die Bewertung der Transformation von maschinell generierten Vorschlägen zu ausgefeilten menschlichen Übersetzungen. Es ist zwar alles andere als perfekt, bietet aber eine präzise, skalierbare und praktische Möglichkeit, den Übersetzungsprozess zu messen. Da KI-Technologien sich weiterentwickeln, wird die Überwachung der Editierdistanz dazu beitragen, Übersetzungen mit minimalem menschlichem Aufwand in hoher Qualität zu gewährleisten.