Mejores Práticas

El camino del traductor hacia la anotación con IA

Un portal a un mundo completamente nuevo. Este pasado febrero me tomé un fin de semana libre de todo y de todos, y me fui a Montevideo, Uruguay. Un fin de semana bastante encantador, podría añadir. Por supuesto, todavía anhelo tiempo real lejos del estrés y unas vacaciones adecuadas en un lugar de ensueño elegido. Por lo tanto, consideré ese fin de semana como un pequeño aperitivo.
Romina C. Cinquemani
11 min
Tabla de contenido

Ojalá hubiera sido una madriguera de conejo de Alicia en el país de las maravillas

Un portal a un mundo completamente nuevo. Este pasado febrero me tomé un fin de semana libre de todo y de todos, y me fui a Montevideo, Uruguay. Un fin de semana bastante encantador, podría añadir. Por supuesto, todavía anhelo tiempo real lejos del estrés y unas vacaciones adecuadas en un lugar de ensueño elegido. Por lo tanto, consideré ese fin de semana como un pequeño aperitivo. Los últimos dos años han sido difíciles para mí en el ámbito de la salud y, como consecuencia, no logré estar al tanto de los avances de la industria a nivel mundial. De ahí la razón por la que el aumento a la velocidad de la luz de la IA me tomó completamente por sorpresa. Debería haberlo sabido mejor. Pero yo estaba ocupado de otra manera, habiéndome extirpado dos partes enteras de mi cuerpo. No se requieren detalles.

Y ahí estaba yo. De vuelta de la encantadora zona de Carrasco en Montevideo con amigos, hermosas playas, palmeras y casas de campo de estilo inglés... Ese fue el momento exacto en que me sentí empujado por un acantilado espantoso e interminable a un abismo inundado de aguas heladas. Sin advertencias. No hay advertencia. Nada. Estando en este lado del mundo, uno podría esperar esta falta de información debido a estar lejos de mi escritorio durante tanto tiempo.

Y así es como mis más de 20 años de experiencia y amor por mi trabajo como traductor se fueron por el desagüe impulsado por la IA. Así de fácil. Tuve un período horrible de 15 días en los que pasé de la ira, a la desesperación, al odio puro por todo el nuevo paradigma y todo lo que lo rodeaba, destellos de esperanza, y luego, un silencio total y completo. Comencé a resurgir de mis propias cenizas profesionales. Tengo 49 años y todavía necesito pagar mis facturas, compartir el apoyo a mi familia, disfrutar un poco de la vida y, si nos volvemos un poco locos, tal vez incluso ahorrar unos dólares de vez en cuando.

De ninguna manera, José. Ni siquiera la IA, pero los entusiastas acérrimos de la IA seguían diciéndome que se había acabado. ¡No paraban de decirme que debería haber terminado antes! El descaro. Todavía lo hacen. Todavía me levantaba con nuevas ideas la mayoría de los días. Y empecé a hablar con colegas sobre esta situación.

Encontramos e incluso hacemos nuestros propios faros

Entonces empecé a leer todo lo que pude encontrar, que sonaba medio inteligente, sobre la IA, sus usos, aplicaciones, principales empresas, roles relevantes, etcétera. Aunque estoy listo y con ganas de aprender cosas nuevas, debo confesar que no iría tan lejos como una nueva carrera universitaria. Ese no es mi objetivo ni una prioridad para mí en esta etapa. Sin embargo, sigo abierto a agregar nuevas habilidades a mi cinturón de herramientas. Como siempre he sido.

Pensé que, si tenía que dejar de lado mi papel de traductor científico-literario, tal vez podría encontrar otra forma de trabajar con las palabras en este nuevo esquema de las cosas. Puedo adaptarme, puedo hacer muchas cosas, incluso puedo empezar de nuevo, pero no voy a renunciar al 100% de las cosas que amo hacer. Puedo flexionar, pero no me romperé. Al igual que el bambú. Durante muchos años he sido una víctima voluntaria, pero una víctima al fin y al cabo, de obligarme a ser otra persona para encajar en las normas sociales. Ni un día más de eso. No a ningún nivel.

Un viaje diferente para todos - Mis notas de campo

Así que ahí fui. En primer lugar, actualicé mi currículum para que reflejara mi perfil profesional, ahora polifacético. Logré comprobar la propuesta actual de formación especializada que se ajustaría a mi horario, mis objetivos y mi presupuesto. Y me inscribí en los elegidos. Estoy, por supuesto, navegando en esas aguas inexploradas. Pero estoy amando cada minuto de ello.

Analicé cuáles eran las empresas de IA más relevantes en este momento. Por supuesto, incluso esto puede cambiar muy rápidamente. Hablamos de un negocio en constante movimiento.

Los principales actores de la industria actual de la IA son OpenAI con ChatGPT, Google con Gemini, Anthropic con Claude, Nvidia y Llama con Meta. Seguro que probablemente ya lo sepas, pero la idea aquí es que me acompañes en el viaje que hice a "AI AI Land".

Terminología básica para captar mi idea

Qué es un anotador de datos de IA - Los anotadores de datos de IA sirven como un puente vital, convirtiendo los datos sin procesar y no estructurados en información legible por máquina, que es el alma de los modelos funcionales de IA.

La anotación de texto marca características, etiqueta la semántica, la composición, el contexto, el propósito, la emoción y otras etiquetas de datos, lo que ayuda a las máquinas a reconocer las intenciones o emociones humanas para una comprensión precisa del lenguaje.

Qué son las terceras empresas - Las empresas de terceros se subcontratan para cumplir una tarea de la empresa principal. En este escenario, muchas antiguas agencias de traducción o incluso empresas de trabajo a distancia son subcontratadas para contratar e incorporar personal para cumplir diferentes funciones relacionadas con la IA.

Qué son los LLM - Los LLM son sistemas de IA que se utilizan para modelar y procesar el lenguaje humano. Se denominan "grandes" porque este tipo de modelos normalmente están formados por cientos de millones o incluso miles de millones de parámetros que definen el comportamiento del modelo, los cuales se entrenan previamente utilizando un corpus masivo de datos de texto.

Grandes apostadores todo el camino

Las empresas de IA no contratan a los anotadores de datos directamente. Externalizan esta tarea a empresas especializadas en la recopilación de datos, anotación y otras áreas. Claramente, están más ocupados desarrollando cosas nuevas cada segundo de cada día.

Confirmado por su propia información interna, puedo mencionar que estas son las conexiones actuales entre las empresas de IA y sus proveedores de recursos (también conocidos como empresas de terceros).

OpenAI, la empresa que está detrás de mí (ChatGPT), contrata anotadores humanos para entrenar y ajustar el modelo. Estos anotadores suelen emplearse a través de una combinación de personal interno y empresas contratistas externas. Su trabajo diario consiste en etiquetar datos, revisar los resultados y proporcionar comentarios para mejorar la precisión, la coherencia y la seguridad del modelo. Su empresa principal es Scale AI.

Google colabora con empresas de terceros para contratar anotadores para entrenar sus modelos de IA, incluido Gemini. Una de las empresas conocidas involucradas en este proceso es Appen. Appen proporciona anotación de datos y otros servicios de entrenamiento de IA, que ayudan a mejorar el rendimiento y la precisión de los modelos de IA como Gemini al proporcionar datos etiquetados de alta calidad.

En 2024, la empresa Scale AI es responsable de contratar anotadores de IA para Anthropic. Scale AI se especializa en proporcionar servicios de etiquetado y anotación de datos que son críticos para entrenar y validar modelos de IA.

Este año, las empresas que contratan anotadores de IA para Nvidia incluyen TELUS International y Appen. TELUS International ofrece anotación de datos, transcripción y moderación de contenido, cruciales para entrenar modelos de IA utilizados por Nvidia y otras empresas tecnológicas. Appen, un conocido líder en servicios de anotación de datos, proporciona datos de entrenamiento de alta calidad esenciales para aplicaciones de aprendizaje automático e inteligencia artificial.

Meta utiliza una combinación de recursos internos y asociaciones externas para la anotación y el ajuste de sus modelos.

Mojando mi pluma en la tinta real

Mientras conectaba todos estos puntos y revisaba sus sitios web, me puse en contacto con las empresas de anotación de datos mencionadas anteriormente. Por supuesto, no todos comparten el mismo HH. RR. o cualquier otra política, para el caso.

Como era de esperar, desde que toda esta revolución comenzó realmente hace un par de años, la mayoría de las empresas de anotación de datos ya tienen equipos de anotadores para miles. Claramente, soy mucho más que un tardío en este juego.

Sin embargo, por curiosidad y ejercicio, me puse en contacto con todas estas empresas que brindan servicios a los gigantes de la IA más poderosos. Como imaginaba, ninguno de ellos se molestó siquiera en responder con un mensaje automático de rechazo. Y sí lo entiendo. De verdad.

Como habrás adivinado, hay muchas más empresas en el mismo negocio con quizás menos popularidad o empresas mutantes que entraron a servir a empresas de IA desde otra industria. En el primer grupo encontré Outlier. Y en el segundo, que viene del negocio de la localización/traducción, tenemos a e2f.

Por supuesto, en muchas ocasiones, este tipo de empresas no revelan el cliente de IA para el que están trabajando. Y eso es totalmente comprensible como parte de sus políticas de confidencialidad y acuerdos entre sí. Esta es la razón por la que no puedo suponer ni inferir para qué empresa de IA trabajan.

Todo lo que reluce...

Como en cualquier otro comercio humano, a veces las empresas comienzan su viaje dentro de una industria y luego se transforman en otro segmento de mercado, debido a innumerables razones. El primero es la supervivencia y el segundo, el poder de su voluntad para progresar.

Después de enviar mi currículum a ambas empresas y de haber trabajado en el pasado para e2f como traductor, recibí un correo electrónico de ambas para continuar con el proceso de incorporación.

Tuve que cumplir y firmar acuerdos de confidencialidad, completar mi perfil dentro de sus sitios web en el portal para colaboradores, realizar varias pruebas, aprobarlas todas y luego asistir a numerosas sesiones de capacitación. De hecho, en una de estas empresas, hay innumerables sesiones de capacitación. La razón es que requieren que los anotadores completen cursos de capacitación para cada nuevo proyecto. Por supuesto, siempre he tomado sesiones de formación adicionales para muchos clientes de traducción en el pasado. El problema aquí es que las sesiones de entrenamiento son demasiadas y demasiado largas. Cuando comienzas a trabajar en las tareas de un proyecto, a muchos de ellos solo se les paga menos de la mitad de la tarifa completa por hora, lo cual es bastante bajo para principiantes. La razón principal es que la empresa considera que estás en formación todo el tiempo. ¿Lo entiendes?

Las diferentes tareas reales dentro de la anotación pueden ser repetitivas en algunos casos, monótonas en otros y bastante complicadas en otros. Hay algunas tareas específicas que me atrajeron un poco más, por ejemplo, escribir indicaciones imaginativas para el modelo de IA con varias restricciones, luego revisar la respuesta de la IA y, finalmente, ofrecer comentarios.

Como todos sabemos, los humanos pueden cometer diferentes tipos de errores en el camino. El problema aquí es que las empresas de anotaciones casi no tienen margen de error. Y cada vez que cometes uno, incluso un pequeño error, es posible que te saquen del equipo de anotaciones.

Otro aspecto negativo de este tipo de trabajo es que, dado que todo en el mundo de la IA está en constante movimiento a una velocidad abrumadora, necesitas asistir a sesiones de retroalimentación todos los días de la semana. Incluso los fines de semana.

Se aplica un requisito específico a este tipo de servicio. Las principales empresas de contratación que mencioné anteriormente, como Appen, por ejemplo, sí tienen una sección de Carreras. La cuestión es que el proceso de anotación necesita que sus equipos humanos estén ubicados dentro de una región específica, incluso si trabajan de forma remota. Esto se debe a razones culturales, antecedentes, conocimientos generales, etcétera.

El elefante extremadamente barato en la habitación

Y por último, llegamos a un tema sensible en cualquier sector de servicios: las tarifas. Si soy honesto, después de investigar este mercado exclusivamente en las perspectivas de anotación de datos, la mayoría de las empresas comparten las mismas tarifas. Pueden dividir el perfil del anotador que buscan en términos de temas más o menos específicos. Aquellos que, por su formación, están cualificados para anotar campos de conocimiento muy específicos, podrían obtener mejores tarifas.

De lo contrario, desde mi punto de vista muy personal, las tarifas que están ofreciendo a los recién llegados al campo de la anotación son monstruosamente bajas. Casi inexistente. Y estas tareas requieren mucha atención a los detalles, comprensión de lectura y mucho tiempo extra para cumplir con los requisitos de la sesión de capacitación y retroalimentación.

Además de eso, la mayoría de las veces, estas empresas tampoco son las mejores en términos de organización. Te lanzan a un canal de Slack que invade tu bandeja de entrada con cientos de mensajes crípticos a los que nadie responde. Esto toma aún más de tu tiempo y no es útil en absoluto. Todo lo contrario.

Para comprobar otros puntos de vista, me puse en contacto con dos colegas sobre su propia experiencia con las empresas de anotación de datos para las que trabajé brevemente. Ambos coincidieron conmigo en cuanto a la falta de organización, la comunicación defectuosa con los equipos de anotadores, el exceso de pruebas y las reuniones de retroalimentación que llevan demasiado tiempo y ponen en peligro los plazos. Por supuesto, todos pensamos que las tarifas son demasiado bajas, pero uno de ellos considera que vale la pena el esfuerzo, si tienes el tiempo para dedicarte a estas tareas.

Las conclusiones

Después de toda esta lectura, investigación, proceso, prueba y error, y escritura, encontré la respuesta a mi pregunta original. ¿Es posible y productivo que un traductor profesional reajuste el rumbo de su carrera y comience un nuevo camino en la anotación de datos?

Todo depende de cada traductor. Tan claro como eso. Aquí no hay absolutos, como en la mayoría de las cosas de la vida. Ahora sé que la anotación de datos no es el nuevo camino que seguiré. Pero realmente disfruté el proceso de descubrir esto.

Sin embargo, esta opción funcionaría bien para traductores con un perfil personal diferente. Traductores recién graduados, jóvenes lingüistas profesionales con pocas o ninguna responsabilidad financiera o familiar que cumplir, o como ingreso complementario, en caso de que ya tengan una fuente de ingresos más conveniente.

La característica más importante de la tarea como anotador de datos es la posibilidad de hacer una pequeña contribución a la calidad de las respuestas de los modelos de IA. Pero para mi perfil particular, el costo es demasiado alto y el pago demasiado bajo. En cualquier caso, valoro mucho la experiencia formativa y todos los conocimientos que tengo ganas de incorporar a partir de ahora.

Libere el poder de la glocalización con nuestro Sistema de Gestión de Traducciones.

Libere el poder de la

con nuestro Sistema de Gestión de Traducciones.

Empezar
Romina C. Cinquemani
Traduce el doble de rápido de forma impecable
Comenzar
¡Nuestros eventos en línea!
Webinars

Prueba Bureau Works gratis durante 14 días

Integración de ChatGPT
Empezar ahora
Los primeros 14 días son gratis.
Soporte básico gratuito