O caminho do tradutor em direção à anotação de IA
O caminho do tradutor em direção à anotação de IA
Um portal para um mundo totalmente novo. Em fevereiro passado, tirei um fim de semana de folga de tudo e de todos, e fui para Montevidéu, no Uruguai. Um fim de semana bastante adorável, devo acrescentar. Claro, ainda estou desejando tempo real longe do estresse e férias adequadas em um local de sonho escolhido. Portanto, considerei aquele fim de semana como um pequeno aperitivo.
Eu gostaria que tivesse sido uma toca de coelho de Alice no País das Maravilhas
Um portal para um mundo totalmente novo. Em fevereiro passado, tirei um fim de semana de folga de tudo e de todos, e fui para Montevidéu, no Uruguai. Um fim de semana bastante adorável, devo acrescentar. Claro, ainda estou desejando tempo real longe do estresse e férias adequadas em um local de sonho escolhido. Portanto, considerei aquele fim de semana como um pequeno aperitivo. Os últimos dois anos foram difíceis para mim na área da saúde e, como consequência, não consegui acompanhar os avanços mundiais da indústria. Daí a razão pela qual o aumento da velocidade da IA me pegou completamente de surpresa. Eu deveria ter sabido. Mas eu estava ocupado de outra forma, tendo removido duas partes inteiras do meu corpo. Não são necessários detalhes.
E lá estava eu. De volta da adorável área de Carrasco em Montevidéu com amigos, lindas praias, palmeiras e casas de campo em estilo inglês... Esse foi o momento exato em que me senti empurrado de um penhasco assustador e sem fim para um abismo inundado de águas congeladas. Sem avisos. Sem avisos. Nada. Estando deste lado do mundo, pode-se esperar essa falta de informação por estar longe da minha mesa por tanto tempo.
E foi assim que meus mais de 20 anos de experiência e amor pelo meu trabalho como tradutor foram pelo ralo impulsionado pela IA. Exatamente assim. Tive um período terrível de 15 dias em que passei da raiva, pelo desespero, pelo ódio absoluto por todo o novo paradigma e tudo ao seu redor, lampejos de esperança e, em seguida, silêncio absoluto e completo. Comecei a me reerguer das minhas próprias cinzas profissionais. Tenho 49 anos e ainda preciso pagar minhas contas, compartilhar o sustento da minha família, aproveitar um pouco a vida e, se ficarmos um pouco loucos, talvez até economizar alguns trocados de vez em quando.
De jeito nenhum, José. Nem mesmo a IA, mas os entusiastas hardcore da IA ficavam me dizendo que estava acabado. Eles continuavam me dizendo que deveria ter acabado antes! A audácia. Eles ainda fazem. Eu ainda acordava com novas ideias na maioria dos dias. E comecei a conversar com colegas sobre essa situação.
Encontramos e até fazemos nossos próprios faróis
Então comecei a ler tudo o que pude encontrar, que parecia meio inteligente, sobre IA, seus usos, aplicações, principais empresas, funções relevantes, etc. Embora eu esteja pronto e ansioso para aprender coisas novas, devo confessar que não iria tão longe a ponto de começar uma nova carreira universitária. Isso não é nem meu objetivo nem uma prioridade para mim nesta fase. No entanto, continuo aberto a adicionar novas habilidades ao meu cinto de ferramentas. Como sempre fui.
Imaginei que, se tivesse que deixar de lado meu papel de tradutor científico-literário, talvez pudesse encontrar outra maneira de trabalhar com as palavras nesse novo esquema de coisas. Posso me adaptar, posso fazer muitas coisas, posso até recomeçar, mas não vou abrir mão de 100% das coisas que amo fazer. Eu posso flexionar, mas não vou quebrar. Assim como o bambu. Por muitos anos, tenho sido uma vítima voluntária, mas ainda assim uma vítima, de me forçar a ser outra pessoa para me adequar às normas sociais. Nem mais um dia disso. Não em nenhum nível.
Uma Jornada Diferente para Todos - Minhas Notas de Campo
Então, lá fui eu. Em primeiro lugar, atualizei meu currículo para que refletisse meu perfil profissional agora multifacetado. Consegui verificar a proposta atual de treinamento especializado que se encaixasse na minha agenda, nos meus objetivos e no meu orçamento. E me inscrevi nos escolhidos. Estou, é claro, navegando nessas águas desconhecidas. Mas estou amando cada minuto disso.
Analisei quais eram as empresas de IA mais relevantes no momento. Claro, mesmo isso pode mudar muito rapidamente. Estamos falando de um negócio em constante movimento.
Os principais atores da indústria de IA atual são OpenAI com ChatGPT, Google com Gemini, Anthropic com Claude, Nvidia e Llama com Meta. Tenho certeza que você provavelmente já sabe disso, mas a ideia aqui é vir comigo na viagem que fiz para "AI AI Land".
Terminologia Básica para Entender Meu Ponto de Vista
O que é um anotador de dados de IA - Os anotadores de dados de IA servem como uma ponte vital, transformando dados brutos e não estruturados em informações legíveis por máquina, que são a força vital dos modelos funcionais de IA.
A anotação de texto marca recursos, rótulos semânticos, composição, contexto, propósito, emoção e outras tags de dados, ajudando as máquinas a reconhecer intenções ou emoções humanas para uma compreensão precisa da linguagem.
O que são empresas terceirizadas - Empresas terceirizadas são subcontratadas para cumprir uma tarefa para a empresa principal. Nesse cenário, muitas antigas agências de tradução ou até mesmo empresas de trabalho remoto são subcontratadas para recrutar e integrar funcionários para desempenhar diferentes funções relacionadas à IA.
O que são LLMs - LLMs são sistemas de IA usados para modelar e processar a linguagem humana. Eles são chamados de "grandes" porque esses tipos de modelos são normalmente feitos de centenas de milhões ou até bilhões de parâmetros que definem o comportamento do modelo, que são pré-treinados usando um enorme corpus de dados de texto.
Grandes apostadores até o fim
As empresas de IA não recrutam anotadores de dados elas mesmas. Eles terceirizam essa tarefa para empresas especializadas em coleta de dados, anotação e outras áreas. Claramente, eles estão mais ocupados desenvolvendo coisas novas a cada segundo de cada dia.
Confirmado por suas próprias informações internas, posso mencionar que essas são as conexões atuais entre as empresas de IA e seus fornecedores de recursos (também conhecidos como empresas terceirizadas).
OpenAI, a empresa por trás de mim (ChatGPT), contrata anotadores humanos para treinar e ajustar o modelo. Esses anotadores são normalmente empregados por meio de uma combinação de funcionários internos e empresas terceirizadas. Seu trabalho diário envolve rotular dados, revisar resultados e fornecer feedback para melhorar a precisão, coerência e segurança do modelo. Sua empresa principal é Scale AI.
Google colabora com empresas terceirizadas para contratar anotadores para treinar seus modelos de IA, incluindo Gemini. Uma das empresas conhecidas envolvidas nesse processo é Appen. Appen fornece anotação de dados e outros serviços de treinamento de IA, que ajudam a melhorar o desempenho e a precisão de modelos de IA como Gemini, fornecendo dados rotulados de alta qualidade.
Em 2024, a empresa Scale AI é responsável pela contratação de anotadores de IA para Anthropic. Scale AI é especializada em fornecer serviços de rotulagem e anotação de dados que são essenciais para treinar e validar modelos de IA.
Este ano, as empresas que contratam anotadores de IA para Nvidia incluem TELUS International e Appen. TELUS International oferece anotação de dados, transcrição e moderação de conteúdo, cruciais para treinar modelos de IA usados por Nvidia e outras empresas de tecnologia. Appen, um conhecido líder em serviços de anotação de dados, fornece dados de treinamento de alta qualidade essenciais para aplicativos de aprendizado de máquina e IA.
Meta usa uma combinação de recursos internos e parcerias externas para a anotação e o ajuste fino de seus modelos.
Mergulhando Minha Caneta na Tinta Real
Ao conectar todos esses pontos e verificar seus sites, entrei em contato com as empresas de anotação de dados mencionadas acima. Claro, nem todos compartilham o mesmo HH. RR. ou quaisquer outras políticas, nesse caso.
Como era de se esperar, desde que toda essa revolução realmente começou há alguns anos, a maioria das empresas de anotação de dados já tem equipes de anotadores para milhares. Claramente, sou muito mais do que um iniciante tardio neste jogo.
No entanto, por curiosidade e exercício, entrei em contato com todas essas empresas que prestam serviços aos gigantes de IA mais poderosos. Como eu imaginava, nenhum deles se deu ao trabalho de responder com uma mensagem automática de recusa. E eu realmente entendo. Realmente.
Como você deve ter adivinhado, existem muitas outras empresas no mesmo ramo, talvez com menos popularidade, ou empresas em mutação que passaram a atender firmas de IA vindas de outro setor. No primeiro grupo, encontrei Outlier. E no segundo, vindo do negócio de localização/tradução, temos e2f.
É claro que, em muitas ocasiões, esse tipo de empresa não revela o cliente de IA para quem está trabalhando. E isso é totalmente compreensível como parte de suas políticas de confidencialidade e acordos entre si. Esta é a razão pela qual não posso presumir nem inferir para qual empresa de IA eles trabalham.
Tudo o que reluz...
Como em qualquer outro comércio humano, às vezes as empresas começam sua jornada dentro de um setor e depois se transformam em outro segmento de mercado, devido a inúmeras razões. O primeiro é a sobrevivência e o segundo, o poder de sua vontade de progredir.
Depois de enviar meu currículo para ambas as empresas e realmente ter trabalhado no passado para e2f como tradutor, recebi um e-mail de ambas para prosseguir com o processo de integração.
Tive que cumprir e assinar acordos de NDA, preencher meu perfil nos sites deles no portal para colaboradores, fazer vários testes, passar em todos eles e depois participar de várias sessões de treinamento. De fato, em uma dessas empresas, existem inúmeras sessões de treinamento. A razão é que eles exigem que os anotadores concluam cursos de treinamento para cada novo projeto. Claro, sempre fiz sessões de treinamento adicionais para muitos clientes de tradução no passado. A questão aqui é que as sessões de treinamento são muitas e muito longas. Quando você começa a trabalhar nas tarefas de um projeto, muitas delas são pagas a menos da metade da taxa horária completa, o que é bastante baixo para iniciantes. A principal razão é que a empresa considera que você está em treinamento o tempo todo. Entendeu?
As diferentes tarefas reais dentro da anotação podem ser repetitivas em alguns casos, monótonas em outros e bastante complicadas em outros. Existem algumas tarefas específicas que me atraíram um pouco mais, por exemplo, escrever prompts imaginativos para o modelo de IA com várias restrições, depois revisar a resposta da IA e, finalmente, oferecer feedback.
Como todos sabemos, os humanos podem cometer diferentes tipos de erros ao longo do caminho. O problema aqui é que as empresas de anotação quase não têm margem para erro. E sempre que você comete um, mesmo que seja um pequeno erro, você pode ser retirado da equipe de anotação.
Outro aspecto negativo desse tipo de trabalho é que, como tudo no mundo da IA está em constante movimento a uma velocidade avassaladora, você precisa participar de sessões de feedback todos os dias da semana. Mesmo nos fins de semana.
Um requisito específico se aplica a esse tipo de serviço. As principais empresas contratantes que mencionei acima, a Appen, por exemplo, possuem uma seção de Carreiras. O fato é que o processo de anotação precisa que suas equipes humanas estejam localizadas em uma região específica, mesmo que trabalhem remotamente. Isso se deve a razões culturais, formação, conhecimento geral, etc.
O elefante extremamente barato na sala
E, finalmente, chegamos a um assunto delicado em qualquer setor de serviços: tarifas. Para ser honesto, depois de pesquisar esse mercado exclusivamente sobre as perspectivas de anotação de dados, a maioria das empresas compartilha as mesmas taxas. Eles podem dividir o perfil do anotador que procuram em termos de assuntos mais ou menos específicos. Aqueles que, devido à sua formação, estão qualificados para anotar campos de conhecimento muito específicos, podem obter melhores taxas.
Caso contrário, do meu ponto de vista muito pessoal, as taxas que eles estão oferecendo aos recém-chegados à arena de anotação são monstruosamente baixas. Quase inexistente. E essas tarefas exigem muita atenção aos detalhes, compreensão de leitura e muito do seu tempo extra para atender aos requisitos da sessão de treinamento e feedback.
Além disso, na maioria das vezes, essas empresas também não são as melhores em termos de organização. Você é jogado em um canal do Slack que invade sua caixa de entrada com centenas de mensagens enigmáticas às quais ninguém responde. Isso toma ainda mais do seu tempo e não é útil de forma alguma. Muito pelo contrário.
Para verificar outros pontos de vista, entrei em contato com dois colegas sobre suas próprias experiências com as empresas de anotação de dados para as quais trabalhei brevemente. Ambos concordaram comigo em termos de falta de organização, comunicação defeituosa com as equipes de anotadores, muitos testes e reuniões de feedback que levam muito tempo e comprometem os prazos. Claro, todos nós achamos que as taxas são muito baixas, mas um deles considera que vale a pena o esforço, se você tiver tempo para se dedicar a essas tarefas.
Os Principais Pontos
Depois de toda essa leitura, pesquisa, processo, tentativa e erro e escrita, encontrei a resposta para minha pergunta original. É possível e produtivo para um tradutor profissional reajustar seu curso de carreira e iniciar um novo caminho em Anotação de Dados?
Tudo depende de cada tradutor. Tão claro quanto isso. Não há absolutos aqui, como na maioria das coisas na vida. Eu sei agora que a Anotação de Dados não é o novo caminho que seguirei. Mas eu realmente gostei do processo de descobrir isso.
No entanto, essa opção funcionaria bem para tradutores com um perfil pessoal diferente. Tradutores recém-formados, jovens linguistas profissionais com poucas ou nenhumas responsabilidades financeiras/familiares a cumprir, ou como renda complementar, caso já tenham uma fonte de renda mais conveniente.
A característica mais importante da tarefa como anotador de dados é a chance de fazer uma pequena contribuição para a qualidade das respostas dos modelos de IA. Mas para o meu perfil particular, o custo é muito alto e o salário muito baixo. De qualquer forma, valorizo muito a experiência de treinamento e todo o conhecimento que estou ansioso para incorporar a partir de agora.