Beste Praktiken

Der Weg des Übersetzers zur KI-Annotation

Ein Portal in eine ganz neue Welt. Im vergangenen Februar habe ich mir ein Wochenende frei genommen und bin nach Montevideo, Uruguay, gereist. Ein ziemlich schönes Wochenende, möchte ich hinzufügen. Natürlich sehne ich mich immer noch nach echter Auszeit vom Stress und einem richtigen Urlaub an einem ausgewählten traumhaften Ort. Daher betrachtete ich dieses Wochenende als winzigen Appetitanreger.
Romina C. Cinquemani
11 min
Inhaltsverzeichniss

Ich wünschte, es wäre ein Kaninchenbau aus Alice im Wunderland gewesen

Ein Portal in eine ganz neue Welt. Im vergangenen Februar habe ich mir ein Wochenende frei genommen und bin nach Montevideo, Uruguay, gereist. Ein ziemlich schönes Wochenende, möchte ich hinzufügen. Natürlich sehne ich mich immer noch nach echter Auszeit vom Stress und einem richtigen Urlaub an einem ausgewählten traumhaften Ort. Daher betrachtete ich dieses Wochenende als winzigen Appetitanreger. Die letzten Jahre waren hart für mich im Gesundheitsbereich, und als Konsequenz habe ich es versäumt, mit den weltweiten Fortschritten in der Branche Schritt zu halten. Daher der Grund, warum mich der rasante Aufstieg der KI völlig überrascht hat. Ich hätte es besser wissen müssen. Aber ich war anderweitig beschäftigt, da ich zwei ganze Teile meines Körpers entfernt hatte. Es sind keine Angaben erforderlich.

Und da war ich. Zurück aus der schönen Carrasco-Gegend in Montevideo mit Freunden, schönen Stränden, Palmen und Landhäusern im englischen Stil... Das war genau der Moment, in dem ich mich von einer furchtbaren und endlosen Klippe in einen Abgrund gestoßen fühlte, der von gefrorenem Wasser überflutet war. Keine Warnungen. Keine Vorwarnung. Nichts. Da ich auf dieser Seite der Welt bin, könnte man diesen Mangel an Informationen erwarten, weil ich so lange nicht an meinem Schreibtisch war.

Und so gingen meine über 20-jährige Erfahrung und Liebe zu meiner Arbeit als Übersetzer den KI-gesteuerten Bach runter. Einfach so. Ich hatte eine schreckliche Periode von 15 Tagen, in der ich von Wut über Verzweiflung, blanken Hass auf das ganze neue Paradigma und alles, was es umgibt, zu Hoffnungsschimmern und dann zu völliger Stille überging. Ich begann, mich aus meiner eigenen beruflichen Asche zu erheben. Ich bin 49 und muss immer noch meine Rechnungen bezahlen, meine Familie unterstützen, das Leben irgendwie genießen und, wenn wir ein bisschen verrückt werden, vielleicht sogar ab und zu ein paar Euro sparen.

Auf keinen Fall, José. Nicht einmal KI, aber KI-Hardcore-Enthusiasten sagten mir immer wieder, dass es vorbei sei. Sie sagten mir immer wieder, dass es früher hätte vorbei sein sollen! Die Frechheit. Das tun sie immer noch. Ich bin immer noch an den meisten Tagen mit neuen Ideen aufgestanden. Und ich fing an, mit Kollegen über diese Situation zu sprechen.

Wir finden und machen sogar unsere eigenen Leuchtfeuer

Dann fing ich an, alles zu lesen, was ich finden konnte, das halbwegs intelligent klang, über KI, ihre Anwendungen, Hauptunternehmen, relevante Rollen usw. Obwohl ich bereit und begierig darauf bin, neue Dinge zu lernen, muss ich gestehen, dass ich nicht so weit gehen würde, eine neue Universitätskarriere anzustreben. Das ist weder mein Ziel noch eine Priorität für mich in dieser Phase. Nichtsdestotrotz bleibe ich offen dafür, meinem Werkzeuggürtel neue Fähigkeiten hinzuzufügen. So wie ich immer gewesen bin.

Ich dachte mir, wenn ich meine Rolle als wissenschaftlich-literarische Übersetzerin beiseite legen müsste, könnte ich vielleicht eine andere Möglichkeit finden, in diesem neuen Schema der Dinge mit Worten zu arbeiten. Ich kann mich anpassen, ich kann viele Dinge tun, ich kann sogar von vorne anfangen, aber ich werde nicht 100% der Dinge aufgeben, die ich gerne tue. Ich kann mich beugen, aber ich werde nicht brechen. Genau wie Bambus. Seit vielen Jahren bin ich ein williges Opfer gewesen, aber dennoch ein Opfer, mich selbst dazu zu zwingen, jemand anderes zu sein, um den gesellschaftlichen Normen zu entsprechen. Nicht noch ein Tag davon. Auf keiner Ebene.

Eine andere Reise für jeden - Meine Feldnotizen

Also, da ging ich hin. Zunächst habe ich meinen Lebenslauf aktualisiert, damit er mein mittlerweile facettenreiches berufliches Profil widerspiegelt. Ich habe es geschafft, den aktuellen Vorschlag für eine spezialisierte Ausbildung zu überprüfen, die zu meinem Zeitplan, meinen Zielen und meinem Budget passt. Und ich schrieb mich bei den Auserwählten ein. Ich segle natürlich in diesen unbekannten Gewässern. Aber ich genieße jede Minute davon.

Ich habe analysiert, welche die derzeit relevantesten KI-Unternehmen sind. Natürlich kann sich auch das sehr schnell ändern. Wir sprechen hier von einem Unternehmen, das sich in ständiger Bewegung befindet.

Die Hauptakteure in der heutigen KI-Branche sind OpenAI mit ChatGPT, Google mit Gemini, Anthropic mit Claude, Nvidia und Llama mit Meta. Ich bin mir sicher, dass ihr das wahrscheinlich schon wisst, aber die Idee hier ist, mich auf der Reise zu begleiten, die ich ins "AI AI Land" gemacht habe.

Grundlegende Terminologie, um meinen Standpunkt zu verstehen

Was ist ein KI-Datenannotator - KI-Datenannotatoren dienen als wichtige Brücke, indem sie rohe, unstrukturierte Daten in maschinenlesbare Informationen umwandeln, die das Lebenselixier funktionaler KI-Modelle sind.

Textanmerkungen markieren Merkmale, Beschriftungen, Semantik, Komposition, Kontext, Zweck, Emotion und andere Daten-Tags und helfen Maschinen, menschliche Absichten oder Emotionen für ein genaues Sprachverständnis zu erkennen.

Was sind Drittunternehmen - Drittfirmen werden unterbeauftragt, um eine Aufgabe für das Hauptunternehmen zu erfüllen. In diesem Szenario werden viele ehemalige Übersetzungsagenturen oder sogar Remote-Arbeitsunternehmen beauftragt, Mitarbeiter zu rekrutieren und einzuarbeiten, um verschiedene Rollen im Zusammenhang mit KI zu erfüllen.

Was sind LLMs - LLMs sind KI-Systeme, die zur Modellierung und Verarbeitung menschlicher Sprache verwendet werden. Sie werden als "groß" bezeichnet, weil diese Arten von Modellen normalerweise aus Hunderten von Millionen oder sogar Milliarden von Parametern bestehen, die das Verhalten des Modells definieren und mit einem riesigen Korpus von Textdaten vortrainiert werden.

High Roller den ganzen Weg

KI-Unternehmen rekrutieren selbst keine Datenannotatoren. Sie lagern diese Aufgabe an Unternehmen aus, die sich auf Datenerfassung, Annotation und andere Bereiche spezialisiert haben. Es ist klar, dass sie jede Sekunde des Tages mehr damit beschäftigt sind, neue Dinge zu entwickeln.

Bestätigt durch ihre eigenen internen Informationen kann ich erwähnen, dass dies die aktuellen Verbindungen zwischen KI-Unternehmen und ihren Ressourcenlieferanten (auch bekannt als Drittunternehmen) sind.

OpenAI, das Unternehmen hinter mir (ChatGPT), stellt menschliche Annotatoren ein, um das Modell zu trainieren und zu optimieren. Diese Annotatoren werden typischerweise durch eine Kombination aus internen Mitarbeitern und externen Vertragsfirmen beschäftigt. Ihre tägliche Arbeit umfasst das Beschriften von Daten, das Überprüfen von Ausgaben und das Bereitstellen von Feedback, um die Genauigkeit, Kohärenz und Sicherheit des Modells zu verbessern. Ihr Hauptunternehmen ist Scale AI.

Google arbeitet mit Drittfirmen zusammen, um Annotatoren für das Training ihrer KI-Modelle zu beauftragen, einschließlich Gemini. Eine der bekannten Firmen, die an diesem Prozess beteiligt sind, ist Appen. Appen bietet Datenannotationen und andere KI-Trainingsdienste an, die dazu beitragen, die Leistung und Genauigkeit von KI-Modellen wie Gemini zu verbessern, indem sie qualitativ hochwertige beschriftete Daten bereitstellen.

Im Jahr 2024 ist das Unternehmen Scale AI für die Einstellung von KI-Annotatoren für Anthropic verantwortlich. Scale AI ist auf die Bereitstellung von Datenbeschriftungs- und Anmerkungsdiensten spezialisiert, die für das Trainieren und Validieren von KI-Modellen von entscheidender Bedeutung sind.

Zu den Unternehmen, die in diesem Jahr KI-Annotatoren für Nvidia einstellen, gehören TELUS International und Appen. TELUS International bietet Datenannotation, Transkription und Inhaltsmoderation, die für das Training von KI-Modellen von Nvidia und anderen Technologieunternehmen von entscheidender Bedeutung sind. Appen, ein bekannter Marktführer für Datenannotationsdienste, bietet qualitativ hochwertige Trainingsdaten, die für maschinelles Lernen und KI-Anwendungen unerlässlich sind.

Meta nutzt eine Kombination aus internen Ressourcen und externen Partnerschaften für die Annotation und Feinabstimmung ihrer Modelle.

Meine Feder in die echte Tinte tauchen

Während ich all diese Punkte miteinander verband und ihre Websites überprüfte, kontaktierte ich die oben genannten Datenannotierungsunternehmen. Natürlich teilen nicht alle das gleiche HH. RR. oder irgendeine andere Politik, was das betrifft.

Erwartungsgemäß haben die meisten Datenannotationsunternehmen, seit diese ganze Revolution vor ein paar Jahren wirklich begann, bereits Annotator-Teams für Tausende. Offensichtlich bin ich viel mehr als nur ein Spätzünder in diesem Spiel.

Nichtsdestotrotz habe ich aus Neugier und Übung all diese Unternehmen kontaktiert, die Dienstleistungen für die mächtigsten KI-Giganten erbringen. Wie ich es mir gedacht hatte, machte sich keiner von ihnen die Mühe, mit einer automatischen Ablehnungsnachricht zu antworten. Und ich verstehe es. Wirklich.

Wie Sie vielleicht schon vermutet haben, gibt es viele weitere Unternehmen im selben Geschäft, die vielleicht weniger bekannt sind oder sich aus einer anderen Branche zu KI-Unternehmen entwickelt haben. In der ersten Gruppe habe ich Ausreißer gefunden. Und im zweiten, aus dem Lokalisierungs-/Übersetzungsgeschäft kommend, haben wir e2f.

Natürlich geben diese Art von Unternehmen bei vielen Gelegenheiten den KI-Kunden, für den sie arbeiten, nicht preis. Und das ist im Rahmen ihrer Vertraulichkeitsrichtlinien und Vereinbarungen untereinander völlig verständlich. Das ist der Grund, warum ich weder annehmen noch ableiten kann, für welches KI-Unternehmen sie arbeiten.

Alles, was glänzt...

Wie in jedem anderen menschlichen Gewerbe beginnen Unternehmen manchmal ihre Reise innerhalb einer Branche und verwandeln sich dann aus unzähligen Gründen in ein anderes Marktsegment. Das erste ist das Überleben und das zweite die Kraft ihres Willens, sich weiterzuentwickeln.

Nachdem ich beiden Unternehmen meinen Lebenslauf geschickt hatte und in der Vergangenheit tatsächlich für e2f als Übersetzer gearbeitet hatte, erhielt ich von beiden eine E-Mail, um mit dem Onboarding-Prozess fortzufahren.

Ich musste NDA-Vereinbarungen erfüllen und unterzeichnen, mein Profil auf ihren Websites im Portal für Mitarbeiter vervollständigen, mehrere Tests ablegen, alle bestehen und dann an zahlreichen Schulungen teilnehmen. Tatsächlich gibt es in einem dieser Unternehmen unzählige Schulungen. Der Grund dafür ist, dass sie von den Annotatoren verlangen, für jedes einzelne neue Projekt Schulungen zu absolvieren. Natürlich habe ich in der Vergangenheit immer zusätzliche Schulungen für viele Übersetzungskunden absolviert. Das Problem dabei ist, dass die Trainingseinheiten zu zahlreich und zu lang sind. Wenn Sie mit der Arbeit an den Aufgaben für ein Projekt beginnen, werden viele von ihnen nur mit weniger als der Hälfte des vollen Stundensatzes bezahlt, was für den Anfang eher niedrig ist. Der Hauptgrund ist, dass das Unternehmen davon ausgeht, dass Sie die ganze Zeit in der Ausbildung sind. Kapiert?

Die eigentlichen verschiedenen Aufgaben innerhalb der Anmerkung können in einigen Fällen repetitiv, in anderen monoton und in wieder anderen recht kompliziert sein. Es gibt ein paar spezifische Aufgaben, die mich etwas mehr angesprochen haben, zum Beispiel das Schreiben fantasievoller Eingabeaufforderungen für das KI-Modell mit mehreren Einschränkungen, dann das Überprüfen der KI-Antwort und schließlich das Geben von Feedback.

Wie wir alle wissen, können Menschen auf ihrem Weg verschiedene Arten von Fehlern begehen. Das Problem hier ist, dass Annotationsunternehmen fast keinen Spielraum für Fehler haben. Und wann immer Sie einen Fehler machen, und sei es auch nur ein winziger, könnten Sie aus dem Anmerkungsteam entfernt werden.

Ein weiterer negativer Aspekt dieser Art von Arbeit ist, dass Sie an jedem einzelnen Tag der Woche an Feedback-Sitzungen teilnehmen müssen, da sich alles in der KI-Welt in ständigem Wandel mit überwältigender Geschwindigkeit befindet. Auch am Wochenende.

Für diese Art von Dienstleistung gilt eine besondere Anforderung. Die wichtigsten Einstellungsunternehmen, die ich oben erwähnt habe, wie zum Beispiel Appen, haben einen Karrierebereich. Die Sache ist die, dass sich die menschlichen Teams für den Annotationsprozess in einer bestimmten Region befinden müssen, auch wenn sie aus der Ferne arbeiten. Dies ist auf kulturelle Gründe, Hintergrund, Allgemeinwissen usw. zurückzuführen.

Der extrem billige Elefant im Raum

Und schließlich kommen wir zu einem heiklen Thema in jeder Dienstleistungsbranche: den Tarifen. Wenn ich ehrlich bin, nachdem ich diesen Markt ausschließlich im Hinblick auf Datenannotationsaussichten untersucht habe, haben die meisten Unternehmen die gleichen Preise. Sie könnten das Profil des Annotators, das sie suchen, in mehr oder weniger spezifische Themenbereiche unterteilen. Diejenigen, die aufgrund ihres Hintergrunds qualifiziert sind, sehr spezifische Wissensgebiete zu kommentieren, könnten bessere Preise erhalten.

Ansonsten sind aus meiner ganz persönlichen Sicht die Preise, die sie Neulingen in der Anmerkungsarena anbieten, monströs niedrig. Fast nicht vorhanden. Und diese Aufgaben erfordern viel Liebe zum Detail, Leseverständnis und viel zusätzliche Zeit, um die Anforderungen der Schulungs- und Feedbacksitzungen zu erfüllen.

Hinzu kommt, dass diese Unternehmen in den meisten Fällen auch nicht die besten sind, was die Organisation angeht. Sie werden in einen Slack-Kanal geworfen, der mit Hunderten von kryptischen Nachrichten, auf die niemand antwortet, in Ihren Posteingang eindringt. Dies nimmt noch mehr von deiner Zeit in Anspruch und ist überhaupt nicht nützlich. Ganz im Gegenteil.

Um andere Standpunkte zu überprüfen, habe ich zwei Kollegen bezüglich ihrer eigenen Erfahrungen mit den Datenannotationsunternehmen, für die ich kurzzeitig gearbeitet habe, kontaktiert. Beide stimmten mir zu, was die mangelnde Organisation, die fehlerhafte Kommunikation mit den Teams der Annotatoren, zu viele Tests und Feedbackgespräche betrifft, die zu viel Zeit in Anspruch nehmen und Termine gefährden. Natürlich denken wir alle, dass die Preise zu niedrig sind, aber einer von ihnen ist der Meinung, dass es die Mühe wert ist, wenn man die Zeit hat, sich diesen Aufgaben zu widmen.

Die Erkenntnisse

Nach all dem Lesen, Recherchieren, Verarbeiten, Ausprobieren und Schreiben fand ich die Antwort auf meine ursprüngliche Frage. Ist es für einen professionellen Übersetzer möglich und produktiv, seinen Karrierekurs neu auszurichten und einen neuen Weg in der Datenannotation einzuschlagen?

Es hängt alles von jedem einzelnen Übersetzer ab. So klar wie das. Hier gibt es keine Absolutheiten, wie bei den meisten Dingen im Leben. Ich weiß jetzt, dass Data Annotation nicht der neue Weg ist, den ich einschlagen werde. Aber ich habe den Prozess, das herauszufinden, wirklich genossen.

Nichtsdestotrotz eignet sich diese Option gut für Übersetzer mit einem anderen persönlichen Profil. Frisch diplomierte Übersetzer, junge professionelle Linguisten mit wenig oder keinen finanziellen/familiären Verpflichtungen, oder als zusätzliches Einkommen, falls sie bereits eine bequemere Einkommensquelle haben.

Das wichtigste Merkmal der Aufgabe als Datenannotator ist die Möglichkeit, einen kleinen Beitrag zur Qualität der Antworten von KI-Modellen zu leisten. Aber für mein spezielles Profil sind die Kosten zu hoch und die Bezahlung zu niedrig. Auf jeden Fall schätze ich die Trainingserfahrung und all das Wissen, das ich von nun an einfließen lassen möchte, sehr.

Nutzen Sie das Potenzial der Glokalisierung mit unserem Translation-Management-System.

Nutzen Sie das Potenzial der

mit unserem Translation-Management-System.

Loslegen
Romina C. Cinquemani
Übersetzen Sie doppelt so schnell und tadellos
Fangen Sie an
Unsere Online-Veranstaltungen!
Webinare

Testen Sie Bureau Works 14 Tage lang kostenlos

ChatGPT-Integration
Jetzt loslegen
Die ersten 14 Tage sind kostenlos
Kostenloser Basis-Support