التايلندية: الكلمات الملتصقة ولغة النغمات والأدب
اللغة التايلندية (ภาษาไทย) هي لغة كرا-داي معقدة موسيقياً وذات نظام كتابة فريد، تمثل تحدياً شرساً لأي نظام للترجمة الآلية. العقبة البصرية الأولى هي الأبجدية التايلندية (وهي في الحقيقة أبوجيدا - Abugida)، حيث لا توجد أي مسافات بين الكلمات! تُكتب الجمل ككتلة واحدة مستمرة من الحروف (بدون فراغات)، ولا تُستخدم المسافات إلا لإنهاء الجمل، تماماً مثل الفواصل والنقاط عندنا. لترجمة هذا النص الملتصق، يستخدم محرك FrancoTranslate الذكاء الاصطناعي لعملية "تجزئة الكلمات" (Tokenization) عبر خوارزميات إحصائية ومعجمية تقطع هذه الكتلة النصية إلى وحدات مفردات منفصلة ذات معنى قبل البدء في الترجمة. التحدي الثاني هو طبيعتها الصوتية النغمية (Tonal Language). تمتلك التايلندية خمس نغمات (عالية، منخفضة، هابطة، صاعدة، ومستوية). الكلمة التي تمتلك نفس الحروف يمكن أن تعني "قريب" أو "بعيد" أو "حمى" بناءً على النغمة التي تقرأ بها! ولحسن الحظ، يتكفل السياق الذي يحلله نظامنا بتوضيح المعنى المقصود لاختيار المترادف العربي السليم.
نحوياً، التايلندية لغة عازلة (Isolating Language). هذا يعني أنه لا يوجد تصريف للأفعال باختلاف الزمن، ولا توجد صيغ للجمع أو الجنس. الكلمة لا تتغير أبداً. بدلاً من ذلك، يستخدم التايلنديون "كلمات مساعدة" للدلالة على الزمن (مثل: "سوف" للمستقبل، و"بالفعل" للماضي). اللغة العربية مبنية بالكامل على التصريف؛ لذا نقوم بامتصاص هذه الكلمات المساعدة، ثم نطبق التصريف العربي المناسب على الفعل مباشرة (يكتب، كتب، سيكتب) لإنتاج ترجمة عربية عالية البلاغة وبعيدة عن الجمود.
كلمات القياس وجزيئات الاحترام المطلقة
كما في الصينية، لا يمكنك عد الأشياء في التايلندية مباشرة (مثل: 3 كلاب). يجب استخدام "كلمات القياس" أو المُصنفات (Classifiers) لتقول: "كلب ثلاثة أجسام". خوارزمياتنا تدرك هذا التركيب الآسيوي، وتقوم بحذف كلمة القياس في الترجمة لتعود للصياغة العربية البسيطة والمباشرة (ثلاثة كلاب).
الثقافة التايلندية تتنفس الاحترام، وهذا ينعكس في "جزيئات التهذيب" التي تضاف في نهاية كل جملة (مثل "كراب - Krub" للرجال، و"كا - Kha" للنساء). نظامنا لا يترجم هذه الحروف المعجمية حرفياً، بل يستبدلها بنبرة احترام عامة في الصياغة العربية (استخدام صيغة الجمع للمخاطب أو كلمات كـ "تفضلوا") لنقل السياق الثقافي المهذب.