Mejores Práticas

GPT-3 x GPT-4, Comparação e Potencial en Traducción

ChatGPT ha cambiado las percepciones en todo el mundo con respecto a las capacidades de la inteligencia artificial. En términos generales, pasó de ser torpe y robótico a ser similar a un humano de una manera inquietante.

Gabriel Fairman

3 min

¿Cómo afecta esto las posibilidades en el ámbito de la traducción?

¿Los humanos ya no son necesarios?

¿Puedo simplemente procesar todo a través de ChatGPT y nunca gastar otro centavo en mis traducciones?

Este artículo explorará el potencial y las limitaciones de las traducciones ofrecidas por los grandes modelos de lenguaje.

¿Quieres hablar con ChatGPT?

Hablar con un transformador generativo pre-entrenado como GPT3/4 u otros chatbots de IA igualmente capaces puede ser tanto iluminador como aterrador. Una respuesta a tu solicitud puede resultar en sorpresa y descontento del usuario. GPT 4 es capaz de aprobar el examen del BAR en el percentil 90 y también es capaz de cometer grandes errores como fabricar hechos incorrectos o aceptar argumentos ilógicos.

Todo depende de los parámetros y los datos de entrenamiento, pero en inglés, GPT 3 y 4 muestran claramente el potencial de cambiar la forma en que llevamos a cabo nuestros trabajos y empleos profesionales.

¿Pero cómo se desempeña en otros idiomas?

¿Cómo funciona con más contexto o menos contexto?

¿Es GPT 3 significativamente diferente de GPT 4?

Traducción automática pero sin un sistema de traducción automática

La historia de la traducción automática ha mostrado claramente los límites de la tecnología en nuestro mundo. Cuando las ideas fueron presentadas por primera vez en los años 80, algunos eran increíblemente optimistas acerca de no requerir más a un humano para generar traducciones precisas.

Era solo cuestión de desarrollar diferentes modelos estadísticos y basados en reglas para crear traducciones que sonaran como hablaría un humano de forma natural.

Pero eso claramente no fue el caso. Los modelos mejoraron y el acceso al conocimiento mejoró, pero el lenguaje simplemente resultó ser demasiado matizado y lleno de excepciones como para que los ingenieros pudieran explicarlo a una máquina. Los modelos no se basaron en un diálogo de pregunta y respuesta, sino en una única salida para la entrada de texto en inglés o cualquier otro idioma abarcado por el motor.

Elegir un modelo y estimar el costo de traducción

Si bien elegir un modelo puede parecer el primer paso lógico para traducir con gpt 3, por ejemplo, es bastante posible que deba ser el último paso en tu viaje de traducción.

Puedes trabajar, por ejemplo, con texto sin formato y simplemente insertarlo en un gpt 3 o trabajar con la API de OpenAI para importar y exportar tu contenido, pero eso pasará por alto algunos de los desafíos clave en torno a las traducciones.

El primero y más obvio, por ejemplo, es la pérdida de formato. A medida que te adentras más en los grandes modelos de lenguaje y otros sistemas de inteligencia artificial, la importancia de la gestión del conocimiento también se vuelve más crítica.

¿Cómo administrarás las traducciones anteriores?

¿Cómo ajustarás tu motor para que tenga en cuenta tu terminología o tu SEO?

Los chatbots de IA, por muy magníficos que sean, no fueron diseñados originalmente como motores de traducción. La traducción de GPT 3 es asombrosa en tantos contextos. A menudo puede presentar a sus usuarios traducciones que parecen humanas y pueden sonar incluso mejor que el texto en inglés o cualquier otro idioma original, pero por sí solo, será casi imposible operar a gran escala o de forma recurrente.

Se necesita un sistema de gestión de traducción que esté profundamente integrado con la inteligencia artificial para asegurarse de que se extraigan los principales beneficios presentados por gpt 3 o 4.

¿Quieres hablar con Character.ai, la última IA creada por los desarrolladores de Google LaMDA?

Las conversaciones de los chatbots, como Character.ai impulsado por LaMDA de Google, muestran claramente cómo es posible tener una conversación similar a la humana sin ningún contexto específico. Es posible hablar con un personaje que construyas o preselecciones de una manera que a veces parece genuinamente humano.

Es importante hablar sobre LaMDA porque a menudo las personas tienen una perspectiva limitada sobre cuántos sistemas existen. Aquí hay algunos ejemplos de otros:
BERT: Bidirectional Encoder Representations from Transformers, desarrollado por Google AI

XLNet: Generalized Autoregressive Pretraining for Language Understanding, desarrollado por la Universidad Carnegie Mellon y Google AI
XLM-RoBERTa: Un enfoque de preentrenamiento BERT robustamente optimizado, desarrollado por Facebook AI
Cohere: Un LLM que puede ser ajustado para dominios y tareas específicas, desarrollado por Cohere AI
GLM-130B: Generative LLM con 130 mil millones de parámetros, desarrollado por Huawei
Meta LLaMA AI: Arquitectura Meta LLM con 1.6 billones de parámetros, desarrollada por Meta AI
Chinchilla: Un modelo de lenguaje grande que puede generar texto con un sonido natural en varios idiomas, desarrollado por LG AI Research
LaMDA: Modelo de Lenguaje para Aplicaciones de Diálogo, desarrollado por Google Research
PaLM: Preentrenamiento de un modelo de lenguaje de autoencodificación y autoregresión para generación condicionada por contexto, desarrollado por DeepMind

GPT 3 fue el primer modelo que logró romper la percepción pública de que la inteligencia artificial era algo exclusivo para ingenieros. Gpt 3 fue el primer modelo de lenguaje que mostró al mundo que la ciencia ficción no es tan ficticia después de todo.

Tipos de entrada en GPT-4 y GPT-3

Cuando se trata de traducción, un usuario puede ingresar texto en la interfaz de chat de GPT-3 o 4 (son la misma interfaz de usuario) y obtener texto traducido cuando se precede de una indicación de traducción. Un usuario está limitado a texto sin formato.

Cualquier formato se perderá y la única forma de preservarlo es trabajar con un sistema de gestión de traducción como BWX que analiza archivos de forma nativa para que la información pueda intercambiarse con GPT 3 y 4 sin pérdida de formato u otra información meta-textual.

Ajuste fino de los modelos de OpenAI

La calidad de la salida de una traducción se basa en la sofisticación del modelo de lenguaje, principalmente en función de los parámetros y el tamaño de los datos de entrenamiento. Pero también se basa en la calidad de la indicación, así como en el contexto adicional proporcionado por una persona (usuario humano).

Cuanto más orientación reciba el modelo de lenguaje, mejor será gpt 3 o 4 para generar palabras que tengan sentido para el lector.

Si describes en tu indicación, por ejemplo, que deseas que la traducción suene informal y llamativa, gpt 3 "hablará" de manera correspondiente y se tomará la libertad de escribir su respuesta de formas que conecten con tu indicación.

Es por eso que en Bureau Works nuestros ingenieros de aprendizaje automático exprimen al máximo el aprendizaje sin etiquetas y el aprendizaje con pocas etiquetas.

Sin entrar demasiado en detalle sobre los tipos de aprendizaje automático y su capacidad para interpretar mensajes y responder de manera coherente para sus usuarios, en Bureau Works nos hemos centrado en construir respuestas desde cero.

La IA debe ser capaz de escribir mensajes que estén contextualizados dentro de las ideas y propósitos de los usuarios.

Si el usuario, por ejemplo, desea que la traducción suene natural aunque se desvíe semánticamente del texto original en inglés, la respuesta puede parecer extraña pero puede ser perfecta para la reacción que una persona en internet debería tener al leer la salida generada por la IA.

BWX es capaz de interactuar nativamente con gpt 3 o 4, así como con otros modelos de IA que tendrán en cuenta:

traducciones pasadas almacenadas en su memoria de traducción
terminología
dominio
formato/etiquetado

A través de este ajuste fino, podemos crear un entorno en el que el sistema pueda procesar datos y proporcionar una respuesta que esté más alineada con las expectativas dentro del contexto de esa interacción.

Un mensaje afinado para gpt 3 o 4 generará palabras que describen conceptos similares con un giro que marca toda la diferencia. Eche un vistazo al siguiente ejemplo:

Resumen Original:

Bureau Works es un sistema de gestión de traducción basado en la nube que transforma la gestión compleja de traducción y localización en actividades simples y predecibles.

Ahora con toque de manzana:

Bureau Works es un magnífico sistema de gestión de traducción que te permite manejar cualquier proyecto de traducción y localización con facilidad y confianza. Es basado en la nube, por lo que puedes acceder a él en cualquier momento y en cualquier lugar.

Ahora con un toque de Kurt Vonnegut:

Bureau Works se preocupa por la traducción y localización. Creemos que tú también deberías. No es fácil llegar a una audiencia global con tu mensaje. Pero podemos ayudarte a hacerlo mejor y más rápido que nunca antes.

Ahora con un toque de la Generación Z:

Bureau Works es genial. Es un sistema que te ayuda a traducir y localizar tus cosas en línea. Puedes usarlo para cualquier cosa: sitios web, aplicaciones, correos electrónicos, documentos, etc. Puedes comenzar de forma gratuita o elegir un plan que se ajuste a tu estilo.

Es a través de estas respuestas que gpt 3 puede hablar de muchas maneras diferentes sobre lo mismo. Es la naturaleza de la escritura. El mismo concepto se puede expresar de innumerables formas diferentes y cada forma tiene la capacidad de evocar diferentes emociones humanas, sin importar si fueron concebidas por una IA o no.

GPT-4 vs. Las capacidades del modelo GPT-3

GPT4 es una evolución natural de GPT 3. GPT 4 tiene aproximadamente 570 veces más parámetros que GPT 3 - 175 mil millones vs. 100 billones de trillones. Esto resulta en un diálogo más consistente y menos errores al comparar los diferentes modelos de IA. GPT 4 también puede analizar entradas visuales. Ambos modelos no fueron entrenados para traducir, pero ambos pueden escribir textos increíblemente naturales palabra por palabra.

Definiendo el contexto de GPT-4 vs. Conversación GPT-3

El contexto se refiere a toda la información que informa el texto pero no es el texto en sí mismo. En una red de significado, el contexto se refiere a todos los hilos que sostienen la red en su conjunto, mientras que el texto es la parte central de la red.

Cuando se trata de IA y significado en general, el contexto lo cambia todo. Si le digo al AI, por ejemplo, que arriba es abajo y abajo es arriba como contexto, y luego le digo al AI que estoy en el séptimo piso y quiero ir al octavo piso, el AI me explicará que debo ir hacia abajo.

El AI dirá esto porque le he dado contexto que guía cómo aborda el texto. Este es un ejemplo extremo de contexto, pero en conversaciones de traducción con un modelo de IA como gpt 3, puedo definir el contexto como ciertas palabras que deben ser utilizadas o evitadas, ciertos tonos que deben seguirse, como formal o informal, o información sobre los objetivos generales del texto que gpt 3 debe tener en cuenta.

Configuración de la API

Cuando se trata de trabajar con gpt 3 o 4 a través de BWX, no es necesario preocuparse por configurar la API. BWX tiene una API nativa con acceso a los puntos finales de gpt 3 y un marco propietario que permite intercambiar información en este proceso con gpt 3 o 4 de la manera más efectiva posible.

Lo bueno es que nuestra API también aprovecha otros modelos de IA además de gpt 3, como LaMDA y LLaMA. Nuestra API utiliza una combinación de modelos de aprendizaje automático para maximizar la relevancia de la escritura de gpt 3 y 4 independientemente de la indicación utilizada.

¿Quieres usar GPT-3?

Usar gpt 3 o 4 con BWX es muy sencillo. Nuestra integración web está habilitada como configuración predeterminada en nuestra aplicación web. Este artículo solo explora la descripción general básica y las capacidades de nuestra integración web gpt 3, pero puedes encontrar más información en caso de que estés interesado en nuestra biblioteca de soporte web en support.bureauworks.com

Puedes registrarte para una prueba gratuita y, por supuesto, puedes cancelar en cualquier momento antes de que finalice tu período de prueba y no se te cobrará.

GPT-3 vs. GPT-4: Puntos clave

En cuanto a GPT 3 vs. GPT 4 aplicado a traducciones no hemos sido capaces de notar desviaciones dramáticas en ejemplos de escritura. Cada modelo es capaz de producir conversaciones relevantes.

Tenemos un informe de 55 páginas lleno de ejemplos generados por gpt 3 que se puede descargar aquí en caso de que estés interesado y estamos trabajando en un nuevo informe que comparará en detalle cómo se desempeña cada modelo.

Tan pronto como esta vista previa de investigación esté disponible, te notificaremos a través de nuestro boletín informativo en caso de que estés interesado. Cada modelo, independientemente de cómo se entrene, ya sea a través de pocos ejemplos, sin ejemplos u otros métodos de aprendizaje automático, es capaz de producir feeds que a veces pueden sorprender a los usuarios de Internet debido a su naturaleza humana inquietante.

Según OpenAI, GPT 4 tiene un rendimiento notablemente mejor que GPT 3 en ciertos escenarios, pero en cuanto a la escritura, el nivel es relativamente similar. Más por venir cuando publiquemos nuestro informe detallado comparando cada modelo.

¿Quieres usar Jurassic-1, el modelo de lenguaje más grande y sofisticado lanzado hasta ahora para uso general por parte de los desarrolladores?

Según Bing, "Jurassic-1 es el nombre dado a un par de modelos de Procesamiento de Lenguaje Natural (NLP) auto-regresivos desarrollados por AI21 Labs de Israel1. Los modelos Jurassic-1 son altamente versátiles, capaces tanto de generar texto similar al humano como de resolver tareas complejas como responder preguntas, clasificar texto y muchas otras2 3.

‍Los modelos Jurassic-1 vienen en dos tamaños, donde la versión Jumbo, con 178 mil millones de parámetros, es el modelo de lenguaje más grande y sofisticado jamás lanzado para uso general por parte de los desarrolladores2 3.

GPT 4 es un modelo de IA con casi 3 veces más parámetros que Jurassic-1 JUMBO. Jurassic-1 solía ser más grande que gpt 3, pero fue superado por gpt 4. Ser más grande que gpt 3 no significaba necesariamente que fuera capaz de producir mejores resultados.

Después de todo, fue el modelo GPT-3 entrenado el que hizo que el mundo abriera los ojos a la verdadera web y a las aplicaciones del mundo real de un modelo de IA. En cuanto a las integraciones, nuestro estado actual y proyecciones indican que BWX se integrará con múltiples modelos para extraer lo mejor que cada modelo ofrece.

Costo de usar GPT-4 vs. GPT-3

Para obtener información sobre los costos de la API de Open AI, visite: https://openai.com/pricing

En cuanto a BWX, no hay diferencia en trabajar con GPT 3 vs. GPT 4. Nuestra API enrutará naturalmente el contenido a través del modelo más efectivo desde una perspectiva costo-beneficio.

Este artículo no entra en detalles técnicos sobre cómo funciona nuestra integración con gpt 3, pero se puede encontrar en la web en nuestra biblioteca de soporte aquí: http://support.bureauworks.com

GPT-4 es actualmente más caro que GPT-3, ya que este modelo utiliza mucha más potencia de cálculo para producir sus respuestas.

GPT-3.5 Turbo actualmente cuesta $0.002 / 1K tokens, mientras que el modelo de GPT 4 con una longitud de 32k cuesta $0.06 / 1K tokens$0.12 / 1K tokens, aproximadamente 30 veces más.

Sin embargo, el plan BWX para Traductores incluye la integración de GPT como parte del precio base que comienza en $9 por usuario con un procesamiento máximo de 200,000 palabras por usuario por ciclo mensual.

Traducción sin entrenamiento

Según nuestros estudios hasta ahora, las traducciones sin entrenamiento no producen resultados consistentes y confiables. Por sorprendente que sea gpt 3 como modelo de lenguaje pre-entrenado, la traducción sin contexto adicional produce resultados mixtos.

Ubicamos mejores resultados ya sea en entornos altamente capacitados o aquellos impulsados por el aprendizaje de pocas muestras.

Con la traducción sin entrenamiento de GPT 3 o 4, es probable que ambos produzcan resultados inconsistentes. Como ha mostrado este artículo, ambos están entrenados por contenido web y producirán diferentes resultados para la misma entrada y ocasionalmente por diseño.

La traducción se trata de aprovechar y construir sobre bases de conocimiento para promover la consistencia de la marca, el SEO, la inteligibilidad y otros requisitos para la aceptación del usuario.

¿Quieres construirlo tú mismo?

Crear una integración con GPT 3 es relativamente sencillo. La API está bien documentada y los endpoints funcionan bien. Hay desafíos en torno a los límites de velocidad, el tamaño del texto y otras restricciones en la arquitectura de la API. Pero lo más importante, desarrollar una integración con GPT 3 o 4 es la parte fácil.

Con el contexto adecuado, tanto GPT 3 como 4 son capaces en teoría de crear la integración por sí mismos. La parte desafiante es que la integración puede obtener texto de entrada y texto de salida, pero tendrá límites claros en cuanto a la preservación del formato, el mantenimiento de la consistencia terminológica, la referencia al material traducido en el pasado como referencia, el aprendizaje a partir de la entrada del usuario y otros escenarios que son fundamentales para producir traducciones de alta calidad a gran escala. ¿Entonces puedes hacerlo tú mismo? Ciertamente.

¿Será efectivo y escalable? Dudoso. Una de las principales lecciones aprendidas hasta ahora de GPT 3 y 4 es que, por magnífica que sea su capacidad, por más parecidos a los humanos que puedan sonar, requieren orientación, estructura y los elementos correctos para ofrecer un rendimiento máximo y constante. Por eso recomendamos que pruebes BWX gratis durante 14 días y veas por ti mismo la magia que puedes extraer de una integración tan profundamente tejida con GPT en un entorno que fue diseñado desde cero para producir traducciones de alta calidad a gran escala con una intervención humana mínima.