Übersetzungseffekt Chat GPT-4 gegen 3.5
Open AI hat gerade GPT-4 veröffentlicht, eine verbesserte Version seiner hochmodernen generativen KI.
Laut Chat GPT selbst besteht der Unterschied zwischen den Modellen aus:
In einfachen Worten ist es größer, besser und gemeiner. Was bedeutet das in Bezug auf Übersetzung und Lokalisierung? Laut Open AI Research:
Einfach ausgedrückt: Stell dir vor, du bist wirklich gut darin, Tests in der Schule zu machen. Sie haben immer gute Noten in Englischtests bekommen, aber Sie möchten sehen, ob Sie auch in Tests in anderen Sprachen gut abschneiden können. Also machen Sie einen großen Test mit 14.000 Fragen in vielen verschiedenen Fächern wie Mathematik, Naturwissenschaften und Geschichte.
Um es noch schwieriger zu machen, machst du den Test in verschiedenen Sprachen mit einem speziellen Werkzeug, das die Fragen für dich in andere Sprachen übersetzt. Du probierst es in 26 verschiedenen Sprachen aus, aber nur 2 davon funktionieren nicht gut.
Überraschenderweise schneiden Sie bei diesem Test in anderen Sprachen sogar besser ab als bei demselben Test auf Englisch. Du schneidest sogar wirklich gut ab in Sprachen, die nicht sehr häufig verwendet werden, wie Lettisch, Walisisch und Swahili.
Das ist so ähnlich wie bei einem Computerprogramm namens GPT-4, das getestet wurde. Es ist wirklich gut darin, Fragen zu verstehen und sie zu beantworten, auch wenn sie in verschiedenen Sprachen gestellt werden. Es hat besser abgeschnitten als andere ähnliche Programme wie GPT-3.5 und Chinchilla, selbst bei den schwierigeren Sprachen.
Lassen Sie uns ein paar Beispiele aus der realen Welt in einigen Sprachen vergleichen.
Eine schnelle Analyse dieser begrenzten Stichprobe von 10 idiomatischen Sätzen in US-Englisch zeigt keine wesentlichen Unterschiede zwischen der Ausgabe von GPT-3 und GPT-4. Dies zeigt, dass:
GPT-3 bereits beeindruckend war, um anzufangen.
Man muss genau auf Details achten, um die Unterschiede zwischen GPT-3 und GPT-4 zu erkennen.
Bei der Untersuchung der subtilen Unterschiede zwischen den beiden war GPT-4 in einem Fall deutlich besser als GPT-3, aber in einem anderen Fall auch bemerkenswert schlechter. In den meisten Fällen war es entweder identisch oder leicht besser.
Die Konzepte, die auf GPT-3 zutrafen, gelten noch mehr für GPT-4. Mit mehr Parametern und Daten werden Prompts immer wichtiger. Schon die geringste Variation in der Prompt-Empfehlung kann deutlich unterschiedliche Ergebnisse liefern. Da das KI-Modell immer weiter verfeinert wird, ist eine größere Präzision vom Benutzer erforderlich.
In Bezug auf andere in OpenAI's Forschung erwähnte Sprachen werden wir in Kürze unsere eigene Untersuchung zu deren Leistung durchführen und Ergebnisse zur Übersetzungsqualität und den Möglichkeiten im Kontext von GPT-3 vs. GPT-4.