Migliori pratiche

La Via del Traduttore Verso l'Annotazione AI

Un portale verso un mondo completamente nuovo. Lo scorso febbraio mi sono preso un weekend libero da tutto e da tutti, e sono andato a Montevideo, in Uruguay. Un fine settimana piuttosto incantevole, potrei aggiungere. Certo, ho ancora voglia di tempo lontano dallo stress e di una vera e propria vacanza in un luogo da sogno scelto. Pertanto, ho considerato quel fine settimana come un piccolo antipasto.
Romina C. Cinquemani
11 min
Sommario

Avrei voluto che fosse stata una tana di coniglio da Alice nel Paese delle Meraviglie

un portale verso un mondo completamente nuovo. Lo scorso febbraio mi sono preso un weekend libero da tutto e da tutti, e sono andato a Montevideo, in Uruguay. Un fine settimana piuttosto incantevole, potrei aggiungere. Certo, ho ancora voglia di tempo lontano dallo stress e di una vera e propria vacanza in un luogo da sogno scelto. Pertanto, ho considerato quel fine settimana come un piccolo antipasto. Negli ultimi due anni ho avuto difficoltà nel campo della salute e, di conseguenza, non sono riuscito a rimanere aggiornato sui progressi del settore a livello mondiale. Ecco perché l'ascesa fulminea dell'IA mi ha colto completamente di sorpresa. Avrei dovuto saperlo meglio. Ma ero impegnato altrimenti, avendo rimosso due parti intere del mio corpo. Non sono richiesti dettagli.

Ed eccomi lì. Di ritorno dall'incantevole zona di Carrasco a Montevideo con gli amici, le belle spiagge, le palme e le case di campagna in stile inglese... Quello è stato il momento esatto in cui mi sono sentito spinto giù da una scogliera spaventosa e infinita in un abisso inondato di acque ghiacciate. Nessun avvertimento. Nessun preavviso. Niente. Essendo da questa parte del mondo, ci si potrebbe aspettare questa mancanza di informazioni a causa del fatto di essere stato lontano dalla mia scrivania per così tanto tempo.

E così è andata la mia esperienza di oltre 20 anni e l'amore per il mio lavoro come Traduttore giù per lo scarico guidato dall'IA. Proprio così. Ho avuto un terribile periodo di 15 giorni in cui sono passato dalla rabbia, alla disperazione, all'odio puro per l'intero nuovo paradigma e tutto ciò che lo circonda, lampi di speranza, e poi, il silenzio totale e completo. Ho iniziato a risorgere dalle mie ceneri professionali. Ho 49 anni e devo ancora pagare le mie bollette, condividere assistenza per la mia famiglia, godermi un po' la vita e, se ci lasciamo andare un po', magari risparmiare qualche soldo di tanto in tanto.

Assolutamente no, José. Nemmeno l'IA, ma gli appassionati più accaniti dell'IA continuavano a dirmi che era finita. Continuavano a dirmi che sarebbe dovuta finire prima! Il coraggio. Lo fanno ancora. Mi alzavo ancora con nuove idee quasi tutti i giorni. E ho iniziato a parlare con i colleghi di questa situazione.

__wf_reserved_inherit

Troviamo e persino creiamo i nostri beacon

Poi ho iniziato a leggere tutto ciò che potevo trovare, che sembrava vagamente intelligente, sull'IA, i suoi usi, applicazioni, principali aziende, ruoli rilevanti, ecc. Anche se sono pronto e desideroso di imparare cose nuove, devo confessare che non mi spingerei fino a intraprendere una nuova carriera universitaria. Quello non è né il mio obiettivo né una priorità per me in questa fase. Ciononostante, rimango aperto ad aggiungere nuove competenze alla mia cintura degli attrezzi. Come sono sempre stato.

Ho pensato che, se dovevo mettere da parte il mio ruolo di Traduttore scientifico-letterario, forse avrei potuto trovare un altro modo di lavorare con le parole in questo nuovo schema delle cose. Posso adattarmi, posso fare molte cose, posso anche ricominciare da capo, ma non rinuncerò al 100% delle cose che amo fare. Posso flettermi, ma non mi spezzerò. Proprio come il bambù. Per molti anni sono stato una vittima volontaria, ma comunque una vittima, di costringermi a essere qualcun altro per adattarmi alle norme della società. Non un altro giorno di quello. Non a nessun livello.

Un viaggio diverso per tutti - I miei appunti sul campo

Così, sono andato. In primo luogo, ho aggiornato il mio curriculum in modo che riflettesse il mio profilo professionale ora multifaccettato. Sono riuscito a verificare l'attuale proposta di formazione specializzata che si adattasse al mio programma, ai miei obiettivi e al mio budget. E mi sono iscritto ai prescelti. Sto navigando, ovviamente, in quelle acque inesplorate. Ma sto amando ogni minuto.

Ho analizzato quali fossero le aziende di intelligenza artificiale più rilevanti giusto ora. Naturalmente, anche questo può cambiare molto rapidamente. Stiamo parlando di un'attività in continuo movimento.

I principali attori dell'industria dell'intelligenza artificiale di oggi sono OpenAI con ChatGPT, Google con Gemini, Anthropic con Claude, Nvidia e Llama con Meta. Sono sicuro che probabilmente lo sai già, ma l'idea qui è di venire con me nel viaggio che ho fatto a "AI AI Land". 

Terminologia di base per capire il mio punto di vista

Cos'è un Annotatore di Dati AI - Gli Annotatori di Dati AI servono come un ponte vitale, trasformando dati grezzi e non strutturati in informazioni leggibili dalla macchina, che sono il fulcro dei modelli di AI funzionali.

La marcatura del testo annota le caratteristiche, etichetta la semantica, la composizione, il contesto, lo scopo, l'emozione e altri tag di dati, aiutando le macchine a riconoscere le intenzioni o le emozioni umane per una comprensione accurata del linguaggio.

Cosa sono le società di terze parti - Le società di terze parti vengono subassunte per svolgere un compito per l'azienda principale. In questo scenario, molte ex agenzie di traduzione o anche aziende di lavoro remoto vengono subassunte per reclutare e integrare personale per ricoprire diversi ruoli legati all'AI.

Cosa sono i LLM - I LLM sono sistemi di intelligenza artificiale utilizzati per modellare e elaborare il linguaggio umano. Sono chiamati "grandi" perché questi tipi di modelli sono normalmente costituiti da centinaia di milioni o addirittura miliardi di parametri che definiscono il comportamento del modello, che vengono pre-addestrati utilizzando un enorme corpus di dati di testo.

High Rollers All The Way

Le aziende di intelligenza artificiale non reclutano autonomamente gli annotatori di dati. Esternalizzano questo compito a società specializzate nella raccolta di dati, nell'annotazione e in altre aree. Chiaramente, sono più impegnati a sviluppare nuove cose ogni secondo di ogni giorno.

Confermato dalle loro stesse informazioni interne, posso menzionare che queste sono le attuali connessioni tra le aziende di intelligenza artificiale e i loro fornitori di risorse (ovvero società di terze parti).

OpenAI, l'azienda dietro di me (ChatGPT), assume annotatori umani per addestrare e mettere a punto il modello. Questi annotatori sono generalmente impiegati attraverso una combinazione di personale interno e aziende appaltatrici di terze parti. Il loro lavoro quotidiano prevede l'etichettatura dei dati, la revisione degli output e la fornitura di feedback per migliorare l'accuratezza, la coerenza e la sicurezza del modello. La loro azienda principale è Scale AI.

Google collabora con aziende di terze parti per l'assunzione di annotatori per addestrare i loro modelli di intelligenza artificiale, tra cui Gemini. Una delle aziende note coinvolte in questo processo è Appen. Appen fornisce servizi di annotazione dei dati e altri servizi di addestramento AI, che aiutano a migliorare le prestazioni e l'accuratezza dei modelli AI come Gemini fornendo dati etichettati di alta Qualità.

Nel 2024, l'azienda Scale AI è responsabile dell'assunzione di annotatori AI per Anthropic. Scale AI è specializzata nella fornitura di servizi di etichettatura e annotazione dei dati fondamentali per l'addestramento e la convalida dei modelli di intelligenza artificiale.

Quest'anno, le aziende che assumono annotatori AI per Nvidia includono TELUS International e Appen. TELUS International offre annotazione dei dati, trascrizione e moderazione del Contenuto, cruciali per l'addestramento dei modelli di intelligenza artificiale utilizzati da Nvidia e altre aziende tecnologiche. Appen, un noto leader nei servizi di annotazione dei dati, fornisce dati di addestramento di alta Qualità essenziali per le applicazioni di apprendimento automatico e intelligenza artificiale.

Meta utilizza una combinazione di risorse interne e collaborazioni esterne per l'annotazione e l'affinamento dei loro modelli.

__wf_reserved_inherit

Dipping My Pen in the Real Ink

Mentre collegavo tutti questi punti e controllavo i loro siti web, ho contattato le aziende di annotazione dati sopra menzionate. Naturalmente, non tutti condividono lo stesso HH. RR. o qualsiasi altra politica, se è per questo.

Come previsto, poiché tutta questa rivoluzione è davvero iniziata un paio di anni fa, la maggior parte delle aziende di annotazione dei dati ha già team di annotatori per le migliaia. Chiaramente, sono molto più di un tardivo in questo gioco.

Tuttavia, per curiosità ed esercizio, ho contattato tutte queste aziende che forniscono servizi ai giganti dell'AI più potenti. Come immaginavo, nessuno di loro si è nemmeno preso la briga di rispondere con un messaggio automatico di rifiuto. E capisco. Davvero.

Come avrete intuito, ci sono molte più aziende nello stesso settore con forse meno popolarità o aziende in trasformazione che sono entrate a servire le imprese di intelligenza artificiale provenendo da un altro settore. Nel primo gruppo ho trovato Outlier. E nel secondo, proveniente dal settore della localizzazione/traduzione, abbiamo e2f.

Naturalmente, in molte occasioni, questo tipo di aziende non rivela il cliente AI per cui stanno lavorando. E questo è pienamente comprensibile come parte delle loro politiche di riservatezza e degli accordi reciproci. Questo è il motivo per cui non posso né presumere né dedurre per quale azienda di intelligenza artificiale lavorino.

Tutto ciò che luccica...

Come in ogni altro commercio umano, a volte le aziende iniziano il loro viaggio all'interno di un settore e poi si trasformano in un altro segmento di mercato, per innumerevoli motivi. La prima è la sopravvivenza e la seconda è il potere della loro volontà di progredire.

Dopo aver inviato il mio curriculum a entrambe le aziende e avendo effettivamente lavorato in passato per e2f come traduttore, ho ricevuto un'email da entrambe per procedere con il processo di onboarding.

Ho dovuto adempiere e firmare accordi di riservatezza (NDA), completare il mio profilo all'interno dei loro siti web nel portale per collaboratori, sostenere diversi test, superarli tutti e poi partecipare a numerose sessioni di formazione. In effetti, in una di queste aziende, ci sono innumerevoli sessioni di formazione. Il motivo è che richiedono agli annotatori di completare i corsi di formazione per ogni singolo nuovo progetto. Certo, ho sempre seguito sessioni di formazione aggiuntive per molti clienti di traduzione in passato. Il problema qui è che le sessioni di allenamento sono troppe e troppo lunghe. Quando inizi a lavorare sui compiti di un progetto, molti di essi vengono pagati meno della metà della tariffa oraria intera, che è piuttosto bassa per i principianti. Il motivo principale è che l'azienda ti considera sempre in formazione. Capisci?

Le diverse attività effettive all'interno dell'annotazione possono essere ripetitive in alcuni casi, monotone in altri e piuttosto complicate in altri. Ci sono alcuni compiti specifici che mi hanno attratto un po' di più, ad esempio scrivere suggerimenti fantasiosi per il modello di intelligenza artificiale con diversi vincoli, quindi rivedere la risposta dell'intelligenza artificiale e infine offrire un feedback.

Come tutti sappiamo, gli esseri umani potrebbero commettere diversi tipi di errori lungo il percorso. Il problema qui è che le società di annotazione non hanno quasi spazio per gli errori. E ogni volta che commetti un errore, anche piccolo, potresti essere rimosso dal team di annotazione.

Un altro aspetto negativo di questo tipo di lavoro è che, poiché tutto nel mondo dell'intelligenza artificiale è in costante movimento a una velocità travolgente, è necessario partecipare a sessioni di feedback ogni singolo giorno della settimana. Anche nei fine settimana.

Un requisito specifico si applica a questo tipo di servizio. Le principali società di assunzione che ho menzionato sopra, come Appen, ad esempio, hanno una sezione Carriere. La questione è che il processo di annotazione richiede che i loro team umani siano situati all'interno di una regione specifica, anche se lavorano da remoto. Ciò è dovuto a motivi culturali, background, cultura generale, ecc.  

L'elefante estremamente economico nella stanza

E infine, arriviamo a un argomento delicato in qualsiasi settore dei servizi: le tariffe. Se devo essere onesto, dopo aver ricercato questo mercato esclusivamente sulle prospettive di Data Annotation, la maggior parte delle aziende condivide le stesse tariffe. Potrebbero dividere il profilo dell'annotatore che cercano in termini di argomenti più o meno specifici. Coloro che, a causa del loro background, sono qualificati per annotare campi di conoscenza molto specifici, potrebbero ottenere tariffe migliori.

Altrimenti, dal mio punto di vista molto personale, le tariffe che stanno offrendo ai nuovi arrivati nell'arena delle annotazioni sono mostruosamente basse. Quasi inesistente. E queste attività richiedono molta attenzione ai dettagli, comprensione della lettura e molto del tuo tempo extra per soddisfare i requisiti delle sessioni di formazione e feedback.

Inoltre, la maggior parte delle volte, queste aziende non sono le migliori nemmeno in termini di Organizzazione. Sei catapultato in un canale Slack che invade la tua casella di posta con centinaia di messaggi criptici a cui nessuno risponde. Questo richiede ancora più tempo e non è affatto utile. Al contrario.

Per verificare altri punti di vista, ho contattato due colleghi riguardo alla loro esperienza con le aziende di annotazione dei dati per cui ho lavorato brevemente. Erano entrambi d'accordo con me in termini di mancanza di Organizzazione, comunicazione difettosa con i team degli annotatori, troppi test e riunioni di feedback che richiedono troppo tempo e mettono a rischio le scadenze. Certo, tutti pensiamo che le tariffe siano troppo basse, ma uno di loro ritiene che ne valga la pena, se si ha il tempo da dedicare a questi compiti.

I Punti Salienti

Dopo tutte queste letture, ricerche, processi, tentativi ed errori e scrittura, ho trovato la risposta alla mia domanda originale. È possibile e produttivo per un/una Traduttore professionista riorientare il proprio percorso di carriera e iniziare un nuovo cammino nella Data Annotation?

Dipende tutto da ogni traduttore. Chiaro come quello. Non ci sono assoluti qui, come nella maggior parte delle cose nella vita. Ora so che l'annotazione dei dati non è la nuova strada che seguirò. Ma mi è piaciuto molto il processo di trovare questo.

Tuttavia, questa opzione funzionerebbe bene per traduttori con un profilo personale diverso. Traduttori neolaureati, giovani linguisti professionisti con poche o nessuna responsabilità finanziaria/familiare da adempiere, o come reddito supplementare, nel caso abbiano già una fonte di reddito più conveniente.

La caratteristica più importante del compito come Data Annotator è l'opportunità di dare un piccolo contributo alla Qualità delle risposte dei modelli di AI. Ma per il mio profilo particolare, il costo è troppo alto e la paga troppo bassa. In ogni caso, apprezzo molto l'esperienza di formazione e tutte le conoscenze che sono ansioso di incorporare d'ora in poi. 

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Romina C. Cinquemani
Passionate about bridging linguistic and cultural gaps through both human skill and cutting-edge translation and localization platforms. Spanish translator, and writer. A constant life apprentice.
Traduci due volte più velocemente in modo impeccabile
Inizia
I nostri eventi online!
Unisciti alla nostra community

Prova Bureau Works gratuitamente per 14 giorni

Il futuro è a pochi clic di distanza
Inizia ora
I primi 14 giorni sono a carico nostro
Supporto di prim'ordine