أفضل الممارسات

ترجمة مدركة للسياق مع نماذج لغوية كبيرة

كانت الترجمة الآلية التقليدية مشكلة لفترة طويلة، حتى مع إدخال الترجمة الآلية العصبية ومجموعات البيانات التدريبية الكبيرة. على الرغم من أنه يمكن أن ينتج عنه نتائج مثيرة للاهتمام عند ضبطه بدقة وتدريبه لمجال معين بلغة يمكن التنبؤ بها ومباشرة، إلا أنه بشكل عام غير موثوق به وغير منتظم عند تطبيقه على مجموعة متنوعة من المجالات واللغات والظروف.
Gabriel Fairman
3 min
Table of Contents

كانت الترجمة الآلية التقليدية مشكلة لفترة طويلة، حتى مع إدخال الترجمة الآلية العصبية ومجموعات البيانات التدريبية الكبيرة. على الرغم من أنه يمكن أن ينتج نتائج مثيرة للاهتمام عند ضبطه بدقة وتدريبه لمجال معين بلغة يمكن التنبؤ بها ومباشرة، إلا أنه بشكل عام غير موثوق به ومتقلب عند تطبيقه على مجموعة متنوعة من المجالات واللغات والظروف.

لا يزال العديد من المترجمون المرموقون لا يحبون الترجمة الآلية ويرفضون استخدامها كمسودة أولى أو إعادة كتابة الموجزات وكالة ترجمة. هذا يبرز الفجوة بين الآلات والبشر، حتى مع التطور الهائل في الترجمة الآلية في السنوات الأخيرة. بناءً على استطلاعنا، فإن نسبة صغيرة فقط من المترجمين يعتبرون الترجمة الآلية حليفًا قيمًا.

الترجمة الآلية التقليدية إما تكون عامة جدًا وغير مستقرة أو محددة جدًا، مما يتطلب ظروفًا خاصة لتكون فعالة، مثل كميات كبيرة من المحتوى مع هيكل لغوي بسيط أو فصل المجالات مثل الأدلة التقنية، وقاعدة معرفة المنتجات، وأدبيات الدعم. حتى المحركات المدربة تواجه صعوبة في التعامل مع عدم اتساق المصطلحات والتباينات بين قواعد المصطلحات وذاكرات الترجمة وتدريب اللغوي.

تشمل هذه الأمور تحديث القواميس من قبل مراجعي الشركة أو المترجمين بعد عملية التدريب، والفروقات بين القواميس ومجموعة التدريب، والحاجة إلى إنشاء وصيانة محركات محددة لتحقيق أقصى درجات الجودة، ذاكرة الترجمة الانحرافات عن مجموعة التدريب، والأخطاء السخيفة مثل ترجمة الكيانات أو الأسماء الصحيحة الأخرى، ونقص الحساسية الثقافية أو اللغوية.

تؤدي هذه الأمثلة إلى موجزات غير موثوقة وعملية مراجعة صعبة للمترجمين. بالإضافة إلى ذلك، فإن إدارة نماذج الترجمة الآلية المضبوطة والمدربة تتطلب عادةً مهندسًا أو أكثر في مجال التوطين مخصصًا لهذه الجهود، وهو أمر لا تمتلك معظم وكالات الترجمة الصغيرة والمتوسطة وبرامج التوطين القدرة على تحمله.

الترجمة المدركة للسياق مع نماذج اللغة الكبيرة، تغير هذا. يشير السياق إلى جميع المعلومات التي ليست النص نفسه ولكنها تساعد المحرك على فهم النص وكيفية معالجته. ومن أمثلة السياق المسارد وذكريات الترجمة والتعليقات السابقة ومعدل الارتداد، ولكن يمكن أن يكون السياق أي معلومات. مع نماذج اللغة الكبيرة التي يمكنها أخذ مليارات المعايير في الاعتبار حسب التصميم، لا يوجد حقًا حد لمقدار السياق الذي تقرر العمل معه.

إليك مثال على أخذ السياق في الاعتبار:

لاحظ كيف أن هناك 89% ذاكرة الترجمة الموجز و الترجمة الآلية الموجز. تطلق الموجز TM على "المحرك" اسم "motor" بالبرتغالية بينما تطلق MT على المحرك اسم "mechanism" بالبرتغالية. ومع ذلك، يحدد مسرد المصطلحات أن "engine" يجب أن تبقى كما هي "engine". عند المعالجة من خلال Bureau Works Translate، يأخذ نموذجنا هذا التفضيل (إلى جانب تفضيلات أخرى) في الاعتبار:

Bureau Works Translate لا يقتصر على إدراج المصطلح الصحيح وفقًا لأحدث إصدار من مسرد المصطلحات فحسب، بل يقوم أيضًا بإجراء أي تغييرات ضرورية على النص بحيث يقرأ بشكل جيد في اللغة المستهدفة مع مراعاة السياق اللغوي الذي تقدمه ذاكرة الترجمة

مع Bureau Works Translate، يمكن لنماذج اللغة الكبيرة مثل ChatGPT أن تأخذ في الاعتبار مجموعة بيانات التدريب الخاصة بها، وذاكرات الترجمة المحددة، والمسارد، والسياق ذي الصلة لتقديم موجز ترجمة دقيق ومراعي للمترجمين في مشروع معين. يمكننا أن نأخذ في الاعتبار أحدث التحديثات على القواميس وذاكرات الترجمة في الوقت الفعلي، مما يعني أنه لا حاجة إلى إرسال القواميس والترجمات المحدثة بشكل متكرر إلى خوادم الترجمة الآلية المدربة والمضبوطة على أمل أن تأخذ في الاعتبار التفضيلات اللغوية.

مع Bureau Works Translate، يمكنك التدريب والترجمة في الوقت الفعلي، وأي مشروع ترجمة، وأي حجم من ذاكرة الترجمة، وأي حجم من مسرد المصطلحات يمكن أن يستفيد من قدراته في دمج النصوص والاحتمالات اللغوية. لا يوجد وقت للإعداد ولا حاجة للتدريب مسبقًا.

بناءً على بحثنا الأولي، يمكن لمثل هذا المحرك أن يوفر المترجمون موجزات تكسر المقاومة الطويلة الأمد تجاه الاستفادة من مخرجات الآلة. يفتح محركنا أيضًا الباب للمحادثة بين المترجم والمحرك. من المنطقي أكثر إثراء مسرد المصطلحات إذا استفدت منه فورًا، ويكون من الأسهل الوثوق بالآلة إذا كنت تعرف من خلال التجربة أن هناك على الأقل شيئًا يشبه التفكير النقدي والتكيفي.

بالإضافة إلى الترجمة المدركة للسياق، لقد فتحنا أيضًا الباب للمترجمين للتفاعل مع نماذج اللغة حتى يتمكنوا من الحصول على رأي ثانٍ حول اختياراتهم، واقتراحات بديلة، وحتى بدء محادثة عند الحاجة.

الترجمة المدركة للسياق مع نماذج اللغات الكبيرة هي أكثر من مجرد عملية محسنة قبل الترجمة. إنها خطوة ثابتة نحو تعاون البشر مع الآلات لإنتاج محتوى أفضل بجهد أقل وفي وقت أقل.

في المستقبل، سيستمر السياق في التوسع بطرق غير مسبوقة وسنكون قادرين على إنشاء نصوص متعددة اللغات مع الأخذ في الاعتبار سلوك المستخدم، وتحليلات الويب، والعديد من مجموعات المعلومات الأخرى التي يمكن استهلاكها وفهمها بواسطة نماذج اللغة الكبيرة. هذه ليست سوى البداية وقد غيرت كل شيء بالفعل.

Unlock the power of glocalization with our Translation Management System.

Unlock the power of

with our Translation Management System.

Sign up today
Gabriel Fairman
Founder and CEO of Bureau Works, Gabriel Fairman is the father of three and a technologist at heart. Raised in a family that spoke three languages and having picked up another three over the course of his life, he has always been fascinated with the role language plays in identity and the creation of meaning. Gabriel loves to cook, play the guitar, tennis, soccer, and ski. As far as work goes, he enjoys being at the forefront of innovation and mobilizing people and teams together toward a mission. In recognition of his outstanding contributions, Gabriel was honored with the 2023 Innovator of the Year Award at LocWorld Silicon Valley.
Translate twice as fast impeccably
Get Started
Our online Events!
Join our community

Try Bureau Works Free for 14 days

The future is just a few clicks away
Get started now
The first 14 days are on us
World-class Support