Kultur

Vad är semantik i maskinöversättning (MT)?

Semantik är viktiga för att producera kontextkänsliga översättningar och MT-system har förbättrats med AI och djupinlärning för att hantera detta område.
Thalita Lima
4 min
Table of Contents

Semantik är ett viktigt studieområde inom översättningsbranschen. Enkelt uttryckt förklarar den hur orden och meningarna är arrangerade för att förmedla de betydelser du avser.

Eftersom MT i allt högre grad är en del av den kontextkänsliga översättningen har semantik också en roll i den här tekniska integrationen. Hur så? Semantik i maskinöversättning är grunden för att träna maskininlärning och uppnå bättre resultat i översättningsprojekt. 

Låt oss börja med att sammanfatta vad semantik är och hur det kan bearbetas av artificiell intelligens.

Semantik Sammanfattning

Semantik är en gren av lingvistik som behandlar betydelse genom korrekt användning av kombinationer av ord och meningar.

Det finns många sätt att ordna detta pussel av textelement och semantik ger oss några begrepp att arbeta med, till exempel:

  • Denotation

Det hänvisar till den bokstavliga betydelsen, objektivt. Vid översättning kan fokus på denotation ibland leda till alltför bokstavliga översättningar, men det kan vara användbart när man hanterar mer traditionellt innehåll, såsom vetenskap.

T.ex.:

"Havet värms upp snabbare på grund av klimatförändringarna". (Svenska)

"Haven värms upp snabbt på grund av klimatförändringarna". (Spanish)

Det finns ingen dubbel betydelse, rätt? Det är ganska tydligt vad meningarna bekräftar för vilket språk som helst.

  • Konnotation

Konnotation involverar de emotionella eller kulturella associationer ett ord bär med sig utöver sin bokstavliga betydelse. 

Dessa nyanser kan variera mycket mellan språk och behöver hanteras noggrant vid översättning, särskilt om du översätter litteratur, e-utbildningar, poesi, etc. Många branscher gör misstag i denna fråga.

T.ex.: ordet "räv"

__wf_reserved_inherit
Får ordet "räv" dig att tänka på detta vilda djur eller påminner det dig om en smart person? Bild av Scott Walsh på unsplash.com

På engelska betecknar ordet "räv" bokstavligen ett vilt djur som är känt för sin listiga natur. Men det har också konnotationer när det används metaforiskt. Att kalla någon för "räv" kan ha olika konnotationer, beroende på sammanhanget:

  • Positiv konnotation: det innebär smarthet eller listighet, som någon strategisk eller kvicktänkt.
  • Negativ konnotation: kan ha en något negativ klang av att vara slug, vilseledande eller opålitlig.
  • Hyponymi och hypernymi

Hyponymi hänvisar till mer specifika termer under en bredare kategori (hypernym). Hypernymer är som ett stort paraply och hyponymer är specifika exempel under det.

Att förstå dessa relationer hjälper till med att välja rätt ord i översättning.

  • Exempel på hyponymi: "Ros", "tulpan" och "tusensköna" är alla hyponymer av hypernymen "blomma". I översättning är valet mellan en hyponym och en hypernym kontextberoende.

    Till exempel är det enkelt att översätta "blomma" till franska som "fleur". Men att översätta "rose" kräver den mer specifika termen "rose", eftersom språket också har specifika ord för varje.

  • Exempel på hypernymi: Om det i den engelska texten står 'flower" men källtexten nämner specifika typer som rosor eller liljor, kan användningen av den generiska termen 'fleur" på franska förlora en viss specificitet.

  • Polysemi

Polysemi hänvisar till ett ord som har flera relaterade betydelser. I översättning är det viktigt att identifiera den korrekta innebörden baserat på sammanhanget.

T.ex.:

Det engelska ordet “bank” kan betyda ett finansinstitut eller sidan av en flod. Om det översätts till franska är finansinstitutet "banque", medan flodbanken är "rive". Översättaren måste välja rätt term baserat på sammanhanget.

  • Tvetydighet

Tvetydighet uppstår när ett ord, en fras eller en mening kan tolkas på mer än ett sätt. Att hantera tvetydighet i översättningen kräver noggrant övervägande av den avsedda betydelsen.

T.ex.:

"Chefen såg medarbetaren med glasögonen" är en tvetydig mening. Har chefen glasögon, eller har medarbetaren det? I översättning kan denna tvetydighet behöva lösas baserat på sammanhanget. 

Till exempel, när man översätter till spanska ordagrant, är tvetydigheten fortfarande närvarande: "Chefen såg medarbetaren med glasögonen". Vem använder glasögonen?

Varför är semantik viktigt i maskinöversättning?

Semantik är närvarande i hur maskiner förstår och bearbetar mänskligt språk. Det är den viktiga punkten i att träna AI för att kunna få den rätta betydelsen av allt innehåll.

Om du använder ett CAT-verktyg med dåliga maskininlärningsprocesser kan de semantiska problemen vi nämnde tidigare förekomma (som problem du behöver lösa): tvetydighet, polysemi, förvirrad användning av konnotation/denotation, etc.

Att få rätt output beror på maskinens förmåga att känna igen kontexten. 

Idiomatisk uttryck är ännu mer känsliga, i de flesta fall behöver du en justering av mänskliga översättare, som förstår de kulturella nyanserna i båda språken.
Om du till exempel översätter frasen "bryta ett ben" ordagrant till ett annat språk kan det leda till ett förvirrande meddelande. På engelska är det ett sätt att önska någon lycka till. Men om vi översätter det till brasiliansk portugisiska, kan du använda "muita merda!", vilket bokstavligen betyder "massor av skit", men med rätt konnotation är det också ett mycket populärt uttryck i den brasilianska teatervärlden för att önska lycka till.

__wf_reserved_inherit
Bild av Dayne Topkin på unsplash.com

Att förstå den semantiska betydelsen gör det möjligt för MT-system att producera en mer exakt och meningsfull översättning.

Deras algoritmer använder semantiska analysmetoder för att extrahera mening från text, vilket inkluderar bearbetning av sentimentanalys, språköversättning och frågesvar. 

Utmaningar i semantik för MT

Du kan föreställa dig att det är utmanande att införa semantik i MT-system. Varje språk har hundratals kulturella sammanhang, idiom och slang, vilket gör det förståeligt varför maskinerna ibland har svårt.

Försök att översätta till ett annat språk i Deep L eller Google Översättare uttrycket Let the CAT out of the bag!” (vilket betyder att avslöja en hemlighet, ofta oavsiktligt”). Resultaten kommer sannolikt att vara underhållande för att vara så bokstavliga!

__wf_reserved_inherit
Bild av Ani Adigyozalyan på unsplahs.com

Även om MT-system har förbättrats med AI och djupinlärning, är det fortfarande ett pågående arbete att fullända semantiken.

Inom teknik och maskinöversättning är att behärska semantik viktiga för att producera korrekta, kontextmedvetna översättningar. Även om MT-verktyg har kommit långt, är det avgörande för framtiden för språkteknologi att förfina hur maskiner förstår och tillämpar semantik.

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Thalita Lima
photography | writing | communication for socio-environmental impact | art
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support