Maskinöversättning är ett ämne som många vet existerar men inte förstår vad det handlar om. Ja, vi vet att det är en automatiserad översättning, men förstår du hur det fungerar? Termen, som används för att beteckna texter översatta av programvara, används främst inom datorlingvistik.
Som ett automatiserat verktyg har maskinöversättning potentialen att förändra hela översättningsfältet. Detta beror på att den på grund av sin tekniska karaktär kan minska kostnaderna för översättning av miljontals dokument avsevärt. Detta kommer i sin tur att hjälpa företag att växa internationellt, vilket katalyserar globaliseringen. För att göra det har forskare redan använt många metoder, såsom regelbaserade och statistiska servrar. Framtiden pekar dock på ett mycket snabbare – och effektivare – sätt att översätta automatiskt: genom att använda artificiell intelligens. Här är allt du behöver veta om saken!
Hur maskinöversättning började
Maskinöversättning, även känd som MT, kan spåras tillbaka till 1629. Detta var året då den franske filosofen René Descartes inledde ett samtal om ett universellt språk. Genom att använda principen om symboler och logik föreslog Descartes en ny form av kommunikation.
Detta universella språk skulle kunna kommunicera motsvarande idéer på olika språk genom en symbol. Ursprungligen tänkte både Descartes och Gottfried Wilhelm Leibniz - en tysk matematiker - på siffror. Men när tiden gick började konceptet med ett universalspråk att tillämpas på maskinöversättning.
Sedan 50-talet har det forskats mycket på att översätta matematiska texter till olika språk. Så småningom resulterade detta i den moderna formen av maskinöversättning. De tre huvudsakliga metoderna för maskinöversättning är:
- Regelbaserad maskinöversättning (1950 - 1980)
- Statistisk maskinöversättning (1990 - 2015)
- Neural maskinöversättning (2015 - Present)
Regelbaserad maskinöversättning
Regelbaserad MT började först utvecklas på 70-talet. Denna metod är också känd som den "Klassiska metoden" för MT och förlitar sig starkt på lingvistiska regler. Som sådan använder den en uppsjö av tvåspråkiga ordböcker för varje språkpar. Regelbaserad maskinöversättning fokuserar på att kartlägga reglerna i olika språk.

Statistisk-baserad maskinöversättning
Statistisk-baserad MT började studeras nästan ett decennium efter regelbaserad MT och är baserad på parametrar från statistiska modeller. Dessa utvecklas genom analys av en uppsättning tvåspråkiga texter. Till skillnad från regelbaserade servrar syftar statistisk baserad MT till att Skapa ett mönsterigenkänning och kräver. Därför kräver det en enorm lingvistisk korpus för att fungera som avsett.

Neural Machine
Neural maskinöversättning (NMT) använder AI och djupinlärning för att uppnå mer precisa översättningar. Artificiella neurala nätverk lär sig att känna igen mönster genom att bearbeta stora mängder data.
Dessa nätverk är inlärningsalgoritmer som tillämpar en icke-linjär funktion på en grupp indata som bildar ett lager. Operationen genererar utdata som kommer att fungera som resurser för nästa lager. Det finns flera lager involverade i det neurala nätverket, kopplade med vikter/parametrar. Alla dessa lager får input med icke-linjära funktioner som ökar möjliga kombinationer.
Därför bearbetar kodarens neurala nätverk en mening på källspråket och omvandlar den till vektorrepresentationer som ska användas i avkodarens neurala nätverk, för att förutsäga meningen på målspråket. NMT kan lära sig från flera datakällor och anpassa sig till olika sammanhang, eftersom modellen är lätt att justera och Uppdatera med valfri databas.
Träningsfasen tar några veckor, men systemet kan automatiskt korrigera sina parametrar. När utdata har genererats och jämförts med den förväntade referensen kan du skicka feedback till maskinen och den kommer att justera vikten på lagren och anslutningarna.
Statistisk kontra Neural Maskin
Man behöver befintliga översättningar för att flöda det Statistiska Maskinöversättningssystemet så att det kan generera hypotesen.När du samlar in tvåspråkiga textkorpusar för att använda som input kan SMT-resultaten variera beroende på Kvaliteten på dessa tidigare översättningar.
Om det rör sig om ett mindre vanligt språk kan det vara svårt att tillhandahålla tillräckligt med tvåspråkigt material för att få bra översättningar. Idiom, ny slang och uttryck, neologismer, språklekar och andra komponenter i litterära och kreativa texter kan också vara ett problem för SMT om dessa språkanvändningar inte finns i de korpusar som används för att träna systemet.
När ordföljden från ett källspråk skiljer sig mycket från målspråket kan resultaten också bli mindre exakta. En annan nackdel är att när systemet väl har implementerats är det svårare att fixa buggar, eftersom du måste starta om det och kontrollera om det finns andra mindre misstag vid införandet av data.

källa: SyncedReview
MT powered by Artificial Intelligence
Även om de regelbaserade, statistiska och neurala metoderna har sina för- och nackdelar, är det obestridligt att de banade väg för vad som kommer härnäst när det gäller maskinöversättning.
Om du inte vet vad vi pratar om kommer här ett tips: det är starkt relaterat till teknik. Nästa generations maskinöversättning kommer att förlita sig på artificiell intelligens och djupinlärning. Och det här är goda nyheter! AI och djupinlärning har potential att förändra maskinöversättningen och ta den till en helt ny nivå, eftersom den kommer att kunna fatta kontextualiserade beslut om betydelsen av ord och termer. AI kommer också att göra det möjligt för MT att bättre känna igen mönster mellan ett språkpar. Hela översättningsprocessen kommer inte att bero enbart på översättare - de kommer att byta roller och bli granskare och testare av resultatet.
Detta kommer att resultera i snabbare och billigare översatta dokument, vilket i slutändan kommer att ge bättre resultat och underlätta kommunikationen mellan människor som talar olika språk. Vi kunde optimera antalet översatta ord med 3,4 eller 5 gånger mer än tidigare - det är bara fantasin som sätter gränser! I det här avseendet är det också viktigt att lära sig nya sätt på vilka vi kan mäta kvaliteten på det översatta innehållet.
Ett av de bästa sätten att göra detta är genom att använda BLEU-poängen, en algoritm som kan mäta Kvaliteten på automatiskt översatta texter. MT som drivs av AI och djupinlärning kommer att göra det möjligt för tusentals företag att överväga att bli globala. Det kommer också att hjälpa internationella organisationer att stanna på marknaden och till och med komma in på andra. Eftersom kostnaden blir betydligt lägre behöver företagen inte fatta kostnadsbaserade beslut när de pratar om vilka språk de ska prioritera.
Företag kommer att vara tillgängliga var som helst på ett lokaliserat sätt. Det verkar bra, rätt? Och det är det! Ändå är det viktigt att notera att vi talar om framtiden. Vi har en lång väg att gå innan vi kommer till den punkt där vi enbart kan förlita oss på AI för att översätta. Som med alla andra begynnande tillvägagångssätt kommer det sannolikt att ta några år att fullt ut utveckla denna nya teknik - och ytterligare några år att helt absorbera tekniken.
Översättarens framtid
Självklart finns det också några utmaningar längs vägen. Rollen för en översättare, till exempel, kommer att behöva omdefinieras nästan helt för att inte bli föråldrad. Men detta representerar också en stor chans för dessa yrkesverksamma att återuppfinna sig själva.
Vi måste se detta som en utmaning som måste övervinnas - inte som ett problem. På så sätt kommer vi att kunna njuta av de positiva aspekterna som artificiell intelligens och djupinlärning kan ge till maskinöversättning. Genom att vara öppna för nyheter, lära oss och anpassa oss, kan vi omvandla maskinöversättning till en djupgående social och ekonomisk omvandling och återuppstå på andra sidan som mer medvetna och bättre rustade människor som kan hantera de utmaningar vi står inför.