¿Qué debo tener en cuenta al migrar de un TMS a otro?
Si estás considerando cambiar TMS(Sistemas de Gestión de Traducción) y alguien te dijo que "¡es fácil! Solo descarga tus archivos TMX y TBX y súbelos a tu nuevo TMS!" - lo más probable es que te esperen dificultades. Cambiar de TMS, aunque aparentemente simple, abre una caja de Pandora llena de dolor.
Pero en este artículo nos centraremos en mi fuente favorita de dolor y terror cuando se trata de la migración de TMS: el aprovechamiento y la adopción de la memoria de traducción.
El mayor problema reside en el aprovechamiento de memorias de traducción. Este es un término de la industria que se refiere a cómo se comparan las oraciones almacenadas en su base de conocimientos con el contenido procesado recientemente. Las memorias de traducción generan enormes ahorros y eficiencias de tiempo. Esta es una de las razones por las que los clientes están dispuestos a invertir de manera optimista en TMS de nivel empresarial. Si tradujiste "El gato está en el sofá." y ahora tienes nuevo contenido que también dice "El gato está en el sofá.", tu TMS reconocerá que esta frase es una coincidencia perfecta y tal vez la preconfirmará o incluso la bloqueará para que no tengas que volver a tocarla nunca más.
El desafío es que los TMS almacenan mucha más información que solo las palabras que ves. Incluso un simple archivo DOCX tiene su propia codificación e incrusta código para el formato, estilos y otros asuntos que son invisibles a simple vista. Entonces, la frase "Ese gato está en el sofá." podría almacenarse como "{1}El gato {1} está en el {2}sofá{2}." Si ese es el caso y vuelves a procesar "El gato está en el sofá.", no tendrás una coincidencia perfecta, sino tal vez una coincidencia del 95 al 99%.
Y aunque eso pueda parecer aceptable si tienes una gran base de contenido que opera en varios idiomas, este cambio en el comportamiento de aprovechamiento podría llevar a que cientos de miles de segmentos requieran ser reprocesados en docenas de idiomas, lo cual tendrá un resultado negativo para la persona que pague la cuenta. Entonces, ¿qué hacer ante esto? Bueno, en vista de esto, antes de migrar, asegúrate de haber probado exhaustivamente el aprovechamiento de la memoria de traducción en una amplia gama de repositorios de contenido y tipos de archivos para establecer una expectativa de referencia para el aprovechamiento. Esto te permitirá abordar cualquier problema potencial antes de comprometerte por completo con tu migración y ya no poder retroceder.
¿Qué hacer si mi referencia no funciona como se esperaba?
Si tu línea base no funciona como se esperaba, el primer paso es buscar la causa raíz de esta pérdida de aprovechamiento. Esto puede residir en tu Memoria de Traducción que contiene la huella de tu antigua estrategia de análisis y segmentación de TMS o en tu nueva estrategia de análisis y segmentación de TMS.
Antes de continuar, definamos el análisis y la segmentación.
El análisis
El análisis es cómo cualquier sistema dado descompone los datos que se le proporcionan. Por ejemplo, el análisis en el lenguaje hablado es cómo nuestros oídos pueden distinguir entre sonidos para entender palabras separadas, por ejemplo. El análisis sintáctico en la localización se refiere a las reglas que sigue un TMS para descomponer el contenido de origen en contenido traducible. Esto incluye, por ejemplo: cómo registra el TMS el formato, cómo registra las variables y cómo separa el código del contenido traducible.
La segmentación
La segmentación se refiere únicamente a lo que constituye una oración. ¿Se define una oración por cierta puntuación? ¿Los saltos de línea resultarán en una nueva oración? Estas reglas diferentes también permitirán un aprovechamiento diferente. Si tradujiste en tu TMS antiguo un archivo PPTX donde varias de tus oraciones se envuelven alrededor del cuadro de texto y tu nuevo TMS no considera los saltos de línea como una separación de oraciones, perderás el aprovechamiento para esa oración en particular. Estas diferentes reglas también permitirán diferentes aprovechamientos. Si tradujiste en tu TMS heredado un archivo PPTX donde varias de tus oraciones se envuelven alrededor del cuadro de texto y tu nuevo TMS entendió estos saltos de línea como divisiones de oraciones y tu nuevo TMS ignora el salto de línea como una división de oraciones, perderás aprovechamiento para esa oración en particular. La pérdida de salto de línea, por ejemplo, puede ser aún más dramática que la pérdida de análisis porque la oración puede volverse completamente irreconocible. ¿Qué puedes hacer al respecto? Afortunadamente, puedes manejar estos problemas con varios enfoques diferentes:
Afortunadamente, puedes manejar estos problemas con varios enfoques diferentes:
El enfoque de fuerza bruta
En este enfoque, simplemente aceptas el hecho de que las migraciones de TMS son complicadas y se esperan algunas pérdidas. Aceptas la pérdida de aprovechamiento y comprendes que al principio la traducción será más costosa y llevará más tiempo, pero pronto se nivelará y volverá a los niveles anteriores una vez que tu base de contenido se ajuste en su mayoría a tu nueva realidad. Este enfoque funciona especialmente bien para programas pequeños (Tamaño del programa = Tamaño de la base de contenido x Idiomas), pero puede generar problemas presupuestarios graves si estás trabajando con programas más grandes.
El enfoque de la Memoria de Traducción
En este enfoque, puedes hacer que los ingenieros de TMS analicen los patrones de codificación en tu Memoria de Traducción y busquen oportunidades para aplicar scripts basados en reglas que transformen estos patrones en patrones más compatibles con tus futuros estándares de TMS. Entonces, digamos por ejemplo que tu TM tiene "El gato está en el sofá." pero tu nuevo TMS ignora la etiqueta {1} y simplemente la registra como "El gato está en el sofá.". Al abordar la TM, ejecutarías un script que comprenda en qué condiciones se introdujo la etiqueta {2} y si estás seguro de que puedes eliminar ese {2} sin más implicaciones, ejecutas ese script. Puedes trabajar de forma iterativa y probar hasta llegar a un punto en el que veas rendimientos marginales decrecientes y ya no tenga sentido económico continuar con los esfuerzos de optimización de la Memoria de Traducción. Este enfoque funciona bien para programas de todos los tamaños, pero introduce la posibilidad de cambiar fundamentalmente el TM de formas inesperadas que pueden resultar en consecuencias no deseadas y, lo más importante, imprevisibles.
El nuevo enfoque de estrategia de análisis y segmentación
En este enfoque, puede abordar cómo su futuro TMS analiza y segmenta el contenido y ajustar estas reglas para que se asemejen más a su Memoria de Traducción. Entonces, en el mismo ejemplo anterior, en lugar de limpiar la TM de la etiqueta {2}, asegurarías que tu futuro TMS también introduzca la etiqueta {2} en una situación de codificación determinada para maximizar el aprovechamiento.
Este enfoque es el más dinámico, ya que no se modifica la Memoria de Traducción y se puede tener un enfoque personalizado para cada tipo de contenido. Por ejemplo, puedes tener diferentes estrategias de análisis para archivos YAML vs DOCX, lo que te brindará la máxima flexibilidad y previsibilidad en el futuro. El desafío de este enfoque es que suele ser más complejo de implementar y no todos los TMS ofrecen la flexibilidad necesaria en cuanto a estrategias de análisis y segmentación.
Conclusión
Migrar TMS no es pan comido. Es más como una compleja travesía por la selva amazónica peruana subiendo los Andes. Es importante identificar y abordar posibles complicaciones desde el principio y, como en cualquier proceso de localización, las cosas se multiplican rápidamente. Asegúrate de realizar pruebas exhaustivas a tu TMS para saber exactamente en qué te estás metiendo y crear estrategias de optimización desde el principio.