Bästa praxis

Kontextmedveten översättning med stora språkmodeller

Traditionell maskinöversättning har varit problematisk under lång tid, även med införandet av neurala maskinöversättningar och stora träningsdatamängder. Även om det kan ge intressanta resultat när det finjusteras och tränas för en specifik domän med förutsägbart och enkelt språk, är det i allmänhet opålitligt och oregelbundet när det tillämpas på en mängd olika domäner, språk och omständigheter.
Gabriel Fairman
3 min
Table of Contents

Traditionell maskinöversättning har varit problematisk under lång tid, även med introduktionen av neuronal maskinöversättning och stora träningsdatamängder. Även om det kan ge intressanta resultat när det finjusteras och tränas för en specifik domän med förutsägbart och enkelt språk, är det i allmänhet opålitligt och oregelbundet när det tillämpas på en mängd olika domäner, språk och omständigheter.

Många ansedda översättare ogillar fortfarande maskinöversättning och vägrar använda det som ett första utkast eller skriva om flödena helt och hållet. Detta belyser klyftan mellan maskiner och människor, även med den enorma utvecklingen av maskinöversättning under de senaste åren. Baserat på vår undersökning anser endast en liten procentandel av översättare att maskinöversättning är en värdefull allierad.

Traditionell maskinöversättning är antingen för generell och oförutsägbar eller för specifik, vilket kräver specifika omständigheter för att vara effektiv, såsom stora volymer av innehåll med enkel lingvistisk struktur eller domänsegregering som tekniska manualer, produktkunskapsbas och supportlitteratur. Även tränade motorer har svårt att hantera inkonsekvent ordbruk och avvikelser mellan termbaser, översättningsminnen och lingvistisk korpusutbildning.

Dessa inkluderar uppdaterade ordlistor av företagsgranskare eller översättare efter utbildningsprocessen, skillnader mellan ordlistor och träningskorpus, behovet av att skapa och underhålla specifika motorer för maximal kvalitet, översättningsminne avvikelser från det tränade korpuset, och dumma misstag som att översätta enheter eller andra egennamn, samt brist på kulturell eller språklig känslighet.

Dessa exempel resulterar i opålitliga flöden och en utmanande granskningsprocess för översättare. Dessutom kräver hantering av justerade och tränade maskinöversättning modeller vanligtvis en eller flera lokaliseringsingenjörer som är dedikerade till dessa insatser, något som de flesta små och medelstora översättningsbyråer och lokaliseringsprogram inte har kapacitet för.

Kontextmedveten översättning med stora språkmodeller ändrar dock på detta. Kontext avser all information som inte är själva texten men som hjälper motorn att förstå texten och hur den ska bearbetas. Exempel på kontext är ordlistor, översättningsminnen, tidigare feedback och avvisningsfrekvens, men kontext kan vara vilken information som helst. Med stora språkmodeller som kan ta hänsyn till miljarder parametrar enligt design, finns det verkligen ingen gräns för hur mycket kontext du väljer att arbeta med.

Här är ett exempel på att ta hänsyn till kontext:

Observera hur det finns ett 89% Översättningsminne flöde och ett maskinöversättning flöde. TM-flödet kallar vår “engine” en “motor” på portugisiska medan MT kallar engine en “mekanism” på portugisiska. Ordlistan specificerar dock att "engine" ska behållas som "engine". När den bearbetas genom Bureau Works Translate, tar vår modell hänsyn till denna preferens (tillsammans med andra):

Bureau Works Translate infogar inte bara rätt term enligt den senaste ordlistversionen utan gör också nödvändiga ändringar i texten så att den läses väl på målspråket, samtidigt som den tar hänsyn till det språkliga sammanhanget som erbjuds av Översättningsminnet

Med Bureau Works Translate kan stora språkmodeller som ChatGPT ta hänsyn till sin egen träningsdatamängd, specifika översättningsminnen, ordlistor och annan relevant kontext för att erbjuda översättare ett nyanserat, kontextualiserat och medvetet översättningsflöde i ett givet projekt. Vi kan ta hänsyn till de senaste uppdateringarna av ordlistor och översättningsminnen i realtid, vilket innebär att det inte finns något behov av att skicka uppdaterade ordlistor och översättningar upprepade gånger till tränade och justerade maskinöversättning servrar för att hoppas att de tar hänsyn till de språkliga preferenserna.

Med Bureau Works Translate kan du träna och översätta direkt, och alla översättningsprojekt, oavsett storlek på översättningsminne och oavsett storlek på ordlista, kan dra nytta av dess textuella sammanslagning och lingvistiska probabilistiska kapaciteter. Det finns ingen ställtid och inget behov av att träna i förväg.

Baserat på vår initiala forskning kan en sådan motor förse översättare med flöden som bryter det långvariga motståndet mot att utnyttja maskinens resultat. Vår motor öppnar också dörren för en konversation mellan översättaren och motorn. Det är mer logiskt att berika en ordlista om du drar nytta av den direkt, och det är lättare att lita på en maskin om du vet från erfarenhet att det åtminstone finns något som liknar kritiskt och adaptivt tänkande.

Förutom den kontextmedvetna översättningen har vi också öppnat dörren för översättare att interagera med språkmodeller så att de kan få ett par extra ögon på sina val, alternativa förslag och till och med starta en konversation vid behov.

Kontextmedveten översättning med stora språkmodeller är mer än en förbättrad föröversättningsprocess. Det är ett fast steg mot att människor arbetar med maskiner för att producera bättre Innehåll med mindre ansträngning och på kortare tid.

Framöver kommer kontexten att fortsätta expandera på oöverträffade sätt och vi kommer att kunna skapa flerspråkiga texter med hänsyn till användarbeteende, webbanalys och en mängd andra informationskällor som kan konsumeras och förstås av stora språkmodeller. Det här är bara början och det har redan förändrat allt.

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Gabriel Fairman
Founder and CEO of Bureau Works, Gabriel Fairman is the father of three and a technologist at heart. Raised in a family that spoke three languages and having picked up another three over the course of his life, he has always been fascinated with the role language plays in identity and the creation of meaning. Gabriel loves to cook, play the guitar, tennis, soccer, and ski. As far as work goes, he enjoys being at the forefront of innovation and mobilizing people and teams together toward a mission. In recognition of his outstanding contributions, Gabriel was honored with the 2023 Innovator of the Year Award at LocWorld Silicon Valley.
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support