Technologie

Edit-Distanz in Übersetzung und Lokalisierung im Jahr 2024

Der Editierabstand zeigt den Aufwand auf, der erforderlich ist, um KI-Übersetzungen zu verfeinern, und hilft, Effizienz und Qualität im Lokalisierungsprozess auszugleichen.
Romina C. Cinquemani
2 minutes, 4 seconds
Inhaltsverzeichniss

Die Bearbeitungsentfernung ist eine entscheidende Kennzahl bei der Übersetzung und Lokalisierung, insbesondere in der heutigen KI-gesteuerten Landschaft. Er misst die Anzahl der Änderungen – Hinzufügungen, Streichungen oder Neuanordnungen –, die an einem bestimmten Textvorschlag vorgenommen wurden, um ihn an die gewünschte Übersetzung anzupassen. Dieser Vorschlag, auch "Feed" genannt, kann aus verschiedenen Quellen stammen, einschließlich:

Das Ziel ist es, zu verfolgen, wie viel Aufwand erforderlich ist, um vom anfänglichen Feed zur endgültigen, bestätigten Übersetzung zu gelangen.

Berechnung der Bearbeitungsentfernung

Schauen wir uns anhand eines einfachen Beispiels an, wie diese Metrik funktioniert. Angenommen, der Feed sagt, „Gabriel ist zum Markt gegangen.“ Ein Übersetzer bearbeitet es zu: "Gabriel ging auf den Markt." So würde die Berechnung aussehen:

  • Löschungen: "hat" und "gegangen" (2 Bearbeitungen)
  • Ergänzungen: "ging" (1 Bearbeitung)
  • Bearbeitungen insgesamt: 3
  • Ursprüngliche Satzlänge: 6 Wörter
  • Distanz in Prozent bearbeiten: 3 ÷ 6 = 50%

Diese Berechnung hilft, den Aufwand des Übersetzers zu quantifizieren. In einigen Fällen können Änderungen 100 % überschreiten, wenn ein gesamt neuer Satz erstellt wird, was die Frage aufwirft, ob der Prozentsatz begrenzt oder es erlaubt werden soll, das gesamte Ausmaß der Modifikationen widerzuspiegeln.

Gabriel Fairman erklärt in seiner Videoserie "Edit Distance":

"Edit-Distanz ist typischerweise die Anzahl der Bearbeitungen, die an einem bestimmten Vorschlag vorgenommen werden, oder was man als Feed bezeichnet, den ein Übersetzer erhält, und die Übersetzung, die der Übersetzer bestätigt"

__wf_reserved_inherit

Warum Edit-Distanz wichtig ist

In einer Ära, in der Übersetzungs-Tools stark auf KI angewiesen sind, bietet die Edit-Distanz Einblick in die Effizienz und Qualität dieser Tools. Es bietet mehrere Vorteile:

  • Bewertung von Feed Qualität: Verfolgt, wie viel Arbeit erforderlich ist, um maschinell generierten Inhalt zu verbessern.
  • Bewertung des Übersetzeraufwands: Misst, wie viel manuelle Eingabe erforderlich ist, um Übersetzungen akzeptabel zu machen.
  • Vergleich verschiedener Sprachen oder Inhalt-Typen: Zeigt Muster auf, wie viel Bearbeitung spezifische Arten von Inhalt über verschiedene Sprachen hinweg erfordern.

Zusammen mit Bearbeitungszeit bietet die Bearbeitungsdistanz eine skalierbare Möglichkeit, die Produktivität und Qualität von Übersetzungsarbeitsabläufen zu messen.

Herausforderungen und zukünftige Auswirkungen

Die Edit-Distanz ist zwar nützlich, hat aber auch Grenzen. Wenn sich KI-generierte Übersetzungen verbessern, sind möglicherweise weniger Bearbeitungen erforderlich. Diese Verschiebung wirft Fragen auf:

  • Ist ein geringerer Bearbeitungsabstand immer besser? Nicht unbedingt – einige sehr nuancierte Übersetzungen können immer noch erhebliche Änderungen erfordern.
  • Sollten Prozentsätze über 100 % normalisiert werden? Wenn größere Umschreibungen häufig vorkommen, kann eine Begrenzung der Prozentsätze auf 100 % die Durchschnittswerte verzerren.
  • Welche anderen Metriken sollten die Bearbeitungsdistanz ergänzen? Das Ausbalancieren der Bearbeitungsdistanz mit Maßnahmen der Ausgabequalität und des Übersetzerverhaltens wird der Schlüssel sein.
__wf_reserved_inherit

Im Zuge der Weiterentwicklung der Branche wird die Bearbeitungsdistanz ein wesentliches Instrument zur Analyse der Übersetzungseffizienz bleiben, aber ihre Rolle wird sich mit den Fortschritten in der KI verändern. Laut unserem CEO, Gabriel Fairman:

"Da der Inhalt von großen Sprachmodellen und maschinellen Übersetzungsmaschinen immer besser wird, bewegen wir uns in eine Richtung, in der wir immer weniger Bearbeitungen sehen, um von maschinellen zu menschlichen Übersetzungen zu gelangen."

Die Bearbeitungsdistanz ist eine grundlegende Kennzahl für die Bewertung der Transformation von maschinell generierten Vorschlägen zu ausgefeilten menschlichen Übersetzungen. Es ist zwar alles andere als perfekt, bietet aber eine präzise, skalierbare und praktische Möglichkeit, den Übersetzungsprozess zu messen. Da KI-Technologien sich weiterentwickeln, wird die Überwachung der Editierdistanz dazu beitragen, Übersetzungen mit minimalem menschlichem Aufwand in hoher Qualität zu gewährleisten.

Nutzen Sie das Potenzial der Glokalisierung mit unserem Translation-Management-System.

Nutzen Sie das Potenzial der

mit unserem Translation-Management-System.

Loslegen
Romina C. Cinquemani
Übersetzen Sie doppelt so schnell und tadellos
Fangen Sie an
Unsere Online-Veranstaltungen!
Webinare

Testen Sie Bureau Works 14 Tage lang kostenlos

ChatGPT-Integration
Jetzt loslegen
Die ersten 14 Tage sind kostenlos
Kostenloser Basis-Support