Bästa praxis

Översättarens väg mot AI-annotering

11 min

Jag önskar att det hade varit ett kaninhål från Alice i Underlandet

En portal till en helt ny värld. I februari i år tog jag ledigt en helg från allt och alla, och jag åkte till Montevideo, Uruguay. Ganska trevlig helg, skulle jag kunna lägga till. Naturligtvis längtar jag fortfarande efter verklig tid bort från stress och en ordentlig semester på en utvald drömsk plats. Därför betraktade jag den helgen som en liten aptitretare. De senaste åren har varit tuffa för mig när det gäller hälsan och som en konsekvens har jag misslyckats med att hålla mig uppdaterad om den globala branschutvecklingen. Därav anledningen till att AI:s uppgång i ljusets hastighet tog mig helt på sängen. Jag borde ha vetat bättre. Men jag var upptagen på annat sätt, jag hade tagit bort två hela kroppsdelar. Inga uppgifter krävs.

Och där var jag. Tillbaka från det vackra Carrasco-området i Montevideo med vänner, härliga stränder, palmer och hus på landet i engelsk stil... Det var i det exakta ögonblicket som jag kände mig knuffad nerför en fruktansvärd och ändlös klippa ner i en avgrund översvämmad av fruset vatten. Inga varningar. Ingen förvarning. Ingenting. Eftersom man befinner sig på den här sidan av världen kan man förvänta sig denna brist på information på grund av att jag har varit borta från mitt skrivbord så länge.

Och så här gick mina över 20 års erfarenhet och kärlek till mitt arbete som översättare ner i den AI-drivna avloppet. Precis så. Jag hade en fruktansvärd period på 15 dagar när jag gick från ilska, genom förtvivlan, rent hat mot hela det nya paradigmet och allt runt omkring, glimtar av hopp, och sedan, fullständig och fullständig tystnad. Jag började resa mig ur min egen yrkesmässiga aska. Jag är 49, och jag behöver fortfarande betala mina räkningar, dela support för min familj, njuta av livet till viss del, och om vi blir lite galna, kanske till och med spara några kronor då och då.

Aldrig, José. Inte ens AI, utan AI-hardcore-entusiaster fortsatte att säga till mig att det var över. De fortsatte att säga att det borde ha varit över tidigare! Vilken fräckhet. De gör det fortfarande. Jag reste mig fortfarande med nya idéer de flesta dagar. Och jag började prata med kollegor om den här situationen.

Vi Hittar och Till och med Skapar Våra Egna Fyrar

Sedan började jag läsa allt jag kunde hitta, som lät någorlunda intelligent, om AI, dess användningar, tillämpningar, huvudföretag, relevanta roller, etc. Även om jag är redo och ivrig att lära mig nya saker, måste jag erkänna att jag inte skulle gå så långt som till en ny universitetskarriär. Det är varken mitt mål eller en prioritet för mig i det här skedet. Ändå är jag fortfarande öppen för att lägga till nya färdigheter till mitt verktygsbälte. Som jag alltid har varit.

Jag insåg att, om jag var tvungen att lägga min roll som vetenskaplig-litterär översättare åt sidan, kanske jag kunde hitta ett annat sätt att arbeta med ord i denna nya ordning av saker. Jag kan anpassa mig, jag kan göra många saker, jag kan till och med börja om, men jag kommer inte att ge upp 100% av de saker jag älskar att göra. Jag kan flexa, men jag kommer inte att gå sönder. Precis som bambu. I många år har jag varit ett villigt offer, men ändå ett offer, för att tvinga mig själv att vara någon annan för att passa in i samhällets normer. Inte en dag till av det. Inte på någon nivå.

En annorlunda resa för alla - mina fältanteckningar

Så, där gick jag. Först uppdaterade jag mitt CV så att det skulle återspegla min nu mångfacetterade yrkesprofil. Jag lyckades kontrollera det nuvarande förslaget om specialiserad utbildning som skulle passa mitt schema, mina mål och min budget. Och jag anmälde mig till de utvalda. Jag seglar naturligtvis i dessa outforskade vatten. Men jag älskar varje minut av det.

Jag analyserade vilka som var de mest relevanta AI-företagen rätt nu. Naturligtvis kan även detta ändras väldigt snabbt. Vi pratar om ett företag i ständig rörelse.

De viktigaste aktörerna i dagens AI-industri är OpenAI med ChatGPT, Google med Gemini, Anthropic med Claude, Nvidia och Llama med Meta. Jag är säker på att du förmodligen redan vet det, men idén här är att följa med mig på resan som jag gjorde till "AI AI Land".

Grundläggande terminologi för att förstå mig

Vad är en AI-dataannotatör - AI-dataannotatörer fungerar som en viktig bro, som omvandlar rå, ostrukturerad data till maskinläsbar information, vilket är livsnerven för funktionella AI-modeller.

Textannotering markerar funktioner, etiketterar semantik, komposition, kontext, syfte, känsla och andra datataggar, vilket hjälper maskiner att känna igen mänskliga avsikter eller känslor för korrekt språkförståelse.

Vad är tredjepartsföretag - Tredjepartsföretag anlitas för att utföra en uppgift för huvudföretaget. I det här scenariot anställs många tidigare översättningsbyråer eller till och med distansarbetsföretag för att rekrytera och introducera personal för att fylla olika roller relaterade till AI.

Vad är LLM:er - LLM:er är AI-system som används för att modellera och bearbeta mänskligt språk. De kallas "stora" eftersom dessa typer av modeller normalt består av hundratals miljoner eller till och med miljarder parametrar som definierar modellens beteende, som är förtränade med hjälp av en massiv korpus av textdata.

High Rollers All The Way

AI-företag rekryterar inte själva dataannotatorer. De lägger ut denna uppgift på företag som är specialiserade på datainsamling, annotering och andra områden. Det är uppenbart att de är mer upptagna med att utveckla nya saker varje sekund av varje dag.

Bekräftat av deras egen interna information kan jag nämna att detta är de nuvarande kopplingarna mellan AI-företag och deras resursleverantörer (aka tredjepartsföretag).

OpenAI, företaget bakom mig (ChatGPT), anställer mänskliga annotatorer för att träna och finjustera modellen. Dessa annotatorer anställs vanligtvis genom en kombination av intern personal och tredjepartskontrakteringsföretag. Deras dagliga arbete innebär att märka data, granska resultat och ge feedback för att förbättra modellens noggrannhet, koherens och säkerhet. Deras primära företag är Scale AI.

Google samarbetar med tredjepartsföretag för att anställa annotatorer för att träna sina AI-modeller, inklusive Gemini. Ett av de kända företagen som är involverade i denna process är Appen. Appen tillhandahåller dataannotering och andra AI-träningstjänster, vilket hjälper till att förbättra prestandan och noggrannheten hos AI-modeller som Gemini genom att tillhandahålla hög-Kvalitet märkt data.

År 2024 ansvarar företaget Scale AI för att anställa AI-annotatorer för Anthropic. Scale AI specialiserar sig på att tillhandahålla datamärknings- och annoteringstjänster som är avgörande för att träna och validera AI-modeller.

I år anlitar företag AI-annotatorer för Nvidia bland annat TELUS International och Appen. TELUS International erbjuder dataannotering, transkription och innehållsmoderering, vilket är avgörande för att träna AI-modeller som används av Nvidia och andra teknikföretag. Appen, en välkänd ledare inom dataannoteringstjänster, tillhandahåller träningsdata av hög Kvalitet som är nödvändig för maskininlärning och AI-applikationer.

Meta använder en kombination av interna resurser och externa partnerskap för annotering och finjustering av sina modeller.

Dipping My Pen in the Real Ink

När jag kopplade ihop alla dessa punkter och kollade deras webbplatser, kontaktade jag de ovan nämnda dataannoteringsföretagen. Naturligtvis delar inte alla av dem samma HH. RR. eller någon annan policy, för den delen.

Som förväntat, eftersom hela denna revolution verkligen började för ett par år sedan, har de flesta dataannoteringsföretag redan annotatörs team för tusentals. Det är uppenbart att jag är mycket mer än en senblommare i det här spelet.

Icke desto mindre, av nyfikenhet och för övningens skull, kontaktade jag alla dessa företag som tillhandahåller tjänster till de mest kraftfulla AI-jättarna. Som jag föreställde mig brydde sig ingen av dem ens om att svara med ett automatiskt meddelande om avslag. Och jag förstår. Verkligen.

Som du kanske har gissat finns det många fler företag i samma bransch med kanske mindre popularitet eller muterande företag som började betjäna AI-företag från en annan bransch. I den första gruppen hittade jag Outlier. Och i den andra, som kommer från lokaliserings-/översättningsbranschen, har vi e2f.Naturligtvis avslöjar den här typen av företag vid många tillfällen inte vilken AI-klient de arbetar för. Och det är fullt förståeligt som en del av deras sekretesspolicyer och avtal med varandra. Detta är anledningen till att jag varken kan anta eller dra slutsatser för vilket AI-företag de arbetar.

Allt som glittrar...

Som i alla andra mänskliga affärer börjar företag ibland sin resa inom en bransch och förvandlas sedan till ett annat marknadssegment, på grund av otaliga anledningar. Den första är överlevnad och den andra är kraften i deras vilja att utvecklas.

Efter att ha skickat mitt CV till båda företagen och faktiskt ha arbetat tidigare för e2f som översättare, fick jag ett e-postmeddelande från dem båda för att gå vidare med introduktionsprocessen.

Jag var tvungen att uppfylla och underteckna NDA-avtal, fylla i min profil på deras webbplatser i portalen för samarbetspartners, göra flera tester, klara dem alla och sedan delta i många utbildningssessioner. Faktum är att det i ett av dessa företag finns otaliga utbildningssessioner. Anledningen är att de kräver att annotatorer genomför utbildningskurser för varje enskilt nytt projekt. Självklart har jag alltid tagit extra träningspass för många översättningsklienter tidigare. Problemet här är att träningspassen är för många och för långa. När du börjar arbeta med uppgifterna för ett projekt, får många av dem bara mindre än hälften av den fulla timtaxan, vilket är ganska lågt för nybörjare. Den främsta anledningen är att företaget anser att du är i träning hela tiden. Fattar du?

De faktiska olika uppgifterna i anteckningen kan vara repetitiva i vissa fall, monotona i andra och ganska komplicerade i andra. Det finns några specifika uppgifter som tilltalade mig lite mer, till exempel att skriva fantasifulla uppmaningar för AI-modellen med flera begränsningar, sedan granska AI-svaret och slutligen ge feedback.

Som vi alla vet kan människor begå olika typer av misstag på vägen. Problemet här är att annoteringsföretag nästan inte har något utrymme för fel. Och när du gör ett, även ett litet misstag, kan du bli borttagen från annoteringsteamet.

En annan negativ aspekt av den här typen av arbete är att eftersom allt i AI-världen är i ständig rörelse i en överväldigande hastighet, måste du delta i feedbacksessioner varje dag i veckan. Även på helgerna.

Ett särskilt krav gäller för denna typ av tjänst. De främsta anställningsföretagen som jag nämnde ovan, som till exempel Appen, har en karriärsektion. Saken är att annoteringsprocessen kräver att deras mänskliga team är placerade inom en specifik region, även om de arbetar på distans. Detta beror på kulturella skäl, bakgrund, allmänbildning etc.

Den extremt billiga elefanten i rummet

Och slutligen kommer vi till ett känsligt ämne i alla servicebranscher: priser. Om jag ska vara ärlig, efter att ha undersökt denna marknad uteslutande på Data Annotation-prospekt, delar de flesta företag samma priser. De kan dela upp annotatörens profil som de söker när det gäller mer eller mindre specifika ämnesområden. De som på grund av sin bakgrund är kvalificerade att kommentera mycket specifika kunskapsområden kan få bättre priser.

Annars, från min mycket personliga synvinkel, är de priser de erbjuder nykomlingar i annoteringsarenan monstruöst låga. Nästan obefintlig. Och dessa uppgifter kräver mycket uppmärksamhet på detaljer, läsförståelse och mycket extra tid för att uppfylla kraven på utbildning och feedbacksession.

Dessutom är dessa företag oftast inte de bästa när det gäller organisation heller. Du kastas in i en Slack-kanal som invaderar din inkorg med hundratals kryptiska meddelanden som ingen svarar på. Detta tar ännu mer av din tid, och det är inte användbart alls. Tvärtom.

För att kontrollera andra synpunkter, kontaktade jag två kollegor angående deras egna erfarenheter med de dataannoteringsföretag jag arbetade kort för. De båda höll med mig när det gäller brist på organisation, bristfällig kommunikation med annotatörernas team, för många tester och återkopplingsmöten som tar för mycket tid och äventyrar deadlines. Naturligtvis tycker vi alla att priserna är för låga, men en av dem anser att det är värt ansträngningen om du har tid att ägna dig åt dessa uppgifter.

Att ta med sig

Efter all denna läsning, forskning, process, försök och misstag och skrivande, hittade jag svaret på min ursprungliga fråga. Är det möjligt och produktivt för en professionell översättare att justera sin karriärbana och börja en ny väg inom Data Annotation?

Det beror helt på varje översättare. Så klart som det. Det finns inga absoluta sanningar här, som i det mesta i livet. Jag vet nu att dataannotering inte är den nya vägen jag kommer att följa. Men jag gillade verkligen processen att hitta detta.

Ändå skulle detta alternativ fungera bra för översättare med en annan personlig profil. Nyligen utexaminerade Översättare, unga professionella lingvister med få eller inga ekonomiska/familjeansvar att uppfylla, eller som en extra inkomst, ifall de redan har en mer bekväm inkomstkälla.

Den viktigaste egenskapen hos uppgiften som Data Annotator är chansen att göra ett litet bidrag till Kvaliteten på AI-modellernas svar. Men för just min profil är kostnaden för hög och lönen för låg. I vilket fall som helst värderar jag träningserfarenheten och all den kunskap jag är ivrig att införliva från och med nu.

Lås upp kraften i glokalisering med vårt översättningshanteringssystem.

Lås upp kraften i

med vårt översättningshanteringssystem.

Registrera dig idag

Romina C. Cinquemani

Passionate about bridging linguistic and cultural gaps through both human skill and cutting-edge translation and localization platforms. Spanish translator, and writer. A constant life apprentice.