Technologie

Worauf sollte ich achten, wenn ich von einem TMS zu einem anderen migriere?

Wenn Sie darüber nachdenken, Ihr TMS (Translation Management System) zu wechseln und Ihnen jemand sagt: "Es ist einfach! Laden Sie einfach Ihre TMX- und TBX-Dateien herunter und laden Sie sie in Ihr neues TMS hoch!" - dann stehen die Chancen gut, dass Sie auf eine Achterbahnfahrt vorbereitet sein sollten. Der Wechsel des TMSs, obwohl scheinbar einfach, öffnet eine Büchse der Pandora voller Schmerzen.

Gabriel Fairman

2 min

Wenn Sie darüber nachdenken, TMS(Translation Management Systems) zu wechseln und Ihnen jemand gesagt hat, dass es "einfach ist! Laden Sie einfach Ihre TMX- und TBX-Dateien herunter und laden Sie sie auf Ihr neues TMS hoch!" - dann stehen die Chancen gut, dass Sie vor einer Herausforderung stehen. Der Wechsel von TMSs, obwohl scheinbar einfach, öffnet eine Büchse der Pandora des Schmerzes.

Aber in diesem Artikel werden wir uns auf meine Lieblingsquelle des Schmerzes und des Schreckens konzentrieren, wenn es um TMS-Migration-Stress geht: Translation-Memory-Nutzung und -Adoption.

Das größte Problem liegt in der Nutzung von Übersetzungsspeichern. Dies ist eine Fachsprache, die sich darauf bezieht, wie die in Ihrer Wissensdatenbank gespeicherten Sätze mit neu verarbeitetem Inhalt verglichen werden. Translation Memories generieren enorme Einsparungen und Zeiteffizienz. Das ist einer der Gründe, warum Kunden bereit sind, in unternehmensweite TMSs zu investieren. Wenn Sie "Die Katze ist auf dem Sofa." übersetzt haben und jetzt neuen Inhalt haben, der auch "Die Katze ist auf dem Sofa." enthält, erkennt Ihr TMS, dass dieser Satz eine perfekte Übereinstimmung ist und möglicherweise vorab bestätigt oder sogar sperrt, sodass Sie ihn nie wieder bearbeiten müssen.

Die Herausforderung besteht darin, dass TMS wesentlich mehr Informationen speichern als nur die sichtbaren Wörter. Selbst eine einfache DOCX-Datei hat ihre eigene Codierung und enthält Code für Formatierung, Stile und andere Dinge, die für das bloße Auge nicht sichtbar sind. Daher könnte der Satz "Diese Katze ist auf dem Sofa." als "{1}Die Katze {1} ist auf dem {2}Sofa{2}." gespeichert sein. Wenn das der Fall ist und Sie "Die Katze ist auf dem Sofa." erneut verarbeiten, haben Sie keine perfekte Übereinstimmung, sondern möglicherweise eine Übereinstimmung von 95 bis 99%.

Und obwohl das akzeptabel erscheinen mag, wenn Sie eine große Inhaltsbasis haben, die in mehreren Sprachen arbeitet, könnte diese Änderung im Hebelverhalten dazu führen, dass Hunderttausende von Segmenten in Dutzenden von Sprachen erneut verarbeitet werden müssen, was zu einem negativen Ergebnis für die Person führt, die die Kosten trägt. Was also tun angesichts dessen? Nun, angesichts dessen sollten Sie sicherstellen, dass Sie vor der Migration eine umfangreiche Testphase für die Hebelung der Übersetzungsspeicher über eine breite Palette Ihrer Inhaltsrepositorys und Dateitypen durchgeführt haben, um eine Grundlinienerwartung für die Hebelung festzulegen. Dadurch können Sie mögliche Probleme angehen, bevor Sie sich vollständig auf Ihre Migration festgelegt haben und nicht mehr zurückkehren können.

Was tun, wenn meine Grundlinie nicht wie erwartet funktioniert?

Wenn Ihre Basislinie nicht wie erwartet funktioniert, ist der erste Schritt, nach der Ursache für diesen Verlust der Hebelwirkung zu suchen. Die Ursache könnte entweder in Ihrer Translation Memory liegen, die den Abdruck Ihrer alten TMS-Analyse- und Segmentierungsstrategie enthält, oder in Ihrer neuen TMS-Analyse- und Segmentierungsstrategie.

Bevor wir weitermachen, definieren wir zunächst Analyse und Segmentierung.

Parsen

Parsen ist die Art und Weise, wie ein bestimmtes System die eingegebenen Daten aufteilt. Beispielsweise ist das Parsing in gesprochener Sprache die Art und Weise, wie unsere Ohren zwischen Klängen unterscheiden können, um separate Wörter zu verstehen. Parsing in der Lokalisierung bezieht sich auf die Regeln, denen ein TMS folgt, um den Quellinhalt in übersetzbaren Inhalt aufzuteilen. Dazu gehört zum Beispiel: Wie zeichnet das TMS die Formatierung auf, wie zeichnet es Variablen auf und wie trennt es Code vom übersetzbaren Inhalt.

Segmentierung

Segmentierung bezieht sich ausschließlich darauf, was einen Satz ausmacht. Wird ein Satz durch bestimmte Satzzeichen definiert? Werden Zeilenumbrüche zu einem neuen Satz führen? Diese unterschiedlichen Regeln ermöglichen auch unterschiedliche Hebelwirkungen. Wenn Sie in Ihrem alten TMS eine PPTX-Datei übersetzt haben, in der mehrere Ihrer Sätze um den Textkasten herum umbrochen sind und Ihr neues TMS diese Zeilenumbrüche nicht als Satzumbrüche betrachtet, verlieren Sie die Hebelwirkung für diesen bestimmten Satz. Der Verlust des Zeilenumbruchs kann zum Beispiel noch dramatischer sein als der Verlust der Analyse, da der Satz vollständig unerkennbar werden kann. Was können Sie dagegen tun?

Glücklicherweise können Sie diese Probleme mit verschiedenen Ansätzen lösen:

Der Brute-Force-Ansatz

Bei diesem Ansatz beißen Sie einfach in den sauren Apfel und akzeptieren, dass TMS-Migrationen unordentlich sind und Verluste zu erwarten sind. Sie akzeptieren einfach den Verlust von Hebelwirkung und verstehen, dass die Übersetzung am Anfang teurer und zeitaufwändiger wird, aber sich bald wieder auf das vorherige Niveau einpendeln wird, sobald Ihre Inhaltsbasis größtenteils an Ihre neue Realität angepasst ist. Dieser Ansatz funktioniert besonders gut für kleine Programme (Programmgröße = Inhaltsbasisgröße x Sprachen), kann jedoch ernsthafte Budgetprobleme verursachen, wenn Sie mit größeren Programmen arbeiten.

Der Ansatz der Übersetzungsspeicher

Bei diesem Ansatz können TMS-Ingenieure Codierungsmuster in Ihrem Übersetzungsspeicher analysieren und nach Möglichkeiten suchen, regelbasierte Skripte anzuwenden, die diese Muster in Muster umwandeln, die besser mit Ihren zukünftigen TMS-Standards kompatibel sind. Angenommen, Ihr TM enthält beispielsweise " {1} Die Katze {1} ist auf dem {2}Sofa{2}." aber Ihr neues TMS ignoriert das Tag {2} und zeichnet es einfach als "{1} Die Katze {1} ist das Sofa." auf. Indem Sie das TM bearbeiten, können Sie ein Skript ausführen, das versteht, unter welchen Bedingungen das Tag {2} eingeführt wurde, und wenn Sie zuversichtlich sind, dass Sie dieses {2} ohne weitere Auswirkungen entfernen können, führen Sie dieses Skript aus. Sie können iterativ arbeiten und testen, bis Sie einen Punkt erreichen, an dem Sie abnehmende Grenzerträge sehen und es wirtschaftlich nicht mehr sinnvoll ist, weitere Anstrengungen zur Optimierung des Translation Memory zu unternehmen. Dieser Ansatz funktioniert gut für Programme jeder Größe, birgt jedoch die Möglichkeit, das TM auf unerwartete Weise grundlegend zu verändern, was zu unerwünschten und vor allem unvorhersehbaren Folgen führen kann.

Der neue Ansatz zur Analyse und Segmentierung

Mit diesem Ansatz können Sie festlegen, wie Ihr zukünftiges TMS Inhalte analysiert und segmentiert und diese Regeln anpassen, damit sie Ihrem Übersetzungsspeicher ähnlicher sind. So würden Sie beispielsweise anstelle des Entfernens des Tags {2} aus der TM sicherstellen, dass Ihr zukünftiges TMS in einer bestimmten Codierungssituation auch das Tag {2} einführt, um den Hebel zu maximieren.

Dieser Ansatz ist am flexibelsten, da das Translation Memory unverändert bleibt und Sie für jeden Inhaltstyp eine maßgeschneiderte Vorgehensweise haben können. So können Sie beispielsweise unterschiedliche Analysestrategien für YAML- und DOCX-Dateien haben, die Ihnen maximale Flexibilität und Vorhersagbarkeit bieten. Die Herausforderung bei diesem Ansatz besteht darin, dass er in der Regel komplexer umzusetzen ist und nicht alle TMSs die notwendige Flexibilität bei Parsing- und Segmentierungsstrategien bieten.

Fazit

Die Migration von TMSs ist kein Spaziergang im Park. Es ist eher wie eine komplexe Wanderung durch den peruanischen Amazonas, aufsteigend in den Anden. Es ist wichtig, potenzielle Komplikationen frühzeitig zu erkennen und anzugehen. Wie bei allem in der Lokalisierung wachsen die Dinge schnell exponentiell. Stellen Sie sicher, dass Sie Ihren TMS gründlich testen, damit Sie genau wissen, worauf Sie sich einlassen, und von Anfang an Optimierungsstrategien entwickeln.

Nutzen Sie das Potenzial der Glokalisierung mit unserem Translation-Management-System.

Nutzen Sie das Potenzial der

mit unserem Translation-Management-System.

Loslegen

Gabriel Fairman

Founder and CEO of Bureau Works, Gabriel Fairman is the father of three and a technologist at heart. Raised in a family that spoke three languages and having picked up another three over the course of his life, he has always been fascinated with the role language plays in identity and the creation of meaning. Gabriel loves to cook, play the guitar, tennis, soccer, and ski. As far as work goes, he enjoys being at the forefront of innovation and mobilizing people and teams together toward a mission. In recognition of his outstanding contributions, Gabriel was honored with the 2023 Innovator of the Year Award at LocWorld Silicon Valley.