الهندية: خط الديفاناغاري وهيمنة الجنس النحوي والإرجاتيف
اللغة الهندية (हिंदी) هي لغة هندو-آرية عريقة وتُعد من أكثر اللغات تحدثاً على مستوى العالم. الخطوة التأسيسية لأي عملية ترجمة من هذه اللغة هي تفكيك "خط الديفاناغاري" (Devanagari)، وهو الخط الجميل الذي تتدلى حروفه من خط أفقي علوي متصل. محرك FrancoTranslate للذكاء الاصطناعي مدرب بصرياً وبرمجياً على فك شفرة هذه الحروف، والحروف المدمجة (Conjuncts) التي تندمج معاً لتكون صوتاً واحداً معقداً. ولكن التحدي الحقيقي الذي يشغل بال المترجمين هو "النظام الصارم للجنس النحوي" (Gender system). في اللغة الهندية، لا تقتصر التفرقة بين المذكر والمؤنث على الكائنات الحية فقط، بل إن كل شيء في الكون (طاولة، كتاب، ماء، شجرة) يجب أن يكون إما مذكراً أو مؤنثاً. وما يزيد الأمر تعقيداً أن هذا الجنس يُجبر الأفعال والصفات المحيطة بالاسم على التغير والتصريف لتتطابق معه! ولأن الأشياء غير العاقلة قد تختلف في جنسها بين الهندية والعربية (فالماء مذكر في الهندية ومذكر في العربية، لكن الكتاب مذكر في العربية ومؤنث في الهندية "पुस्तिका")، يجب على خوارزمياتنا إجراء "إعادة ضبط للجنس"؛ حيث تُهمل جنس الكلمة الهندي، وتقوم بتصريف الأفعال والصفات لتطابق الجنس العربي للكلمة المستهدفة حصرياً لضمان عدم حدوث ركاكة في النص.
التحدي القواعدي الأعظم في الهندية هو ظاهرة "الإرجاتيفية المنقسمة" (Split Ergativity) في الزمن الماضي. في معظم الحالات العادية، يتصرف الفعل بناءً على "الفاعل" (أنا ذهبت، هي ذهبت). لكن في الهندية، إذا كان الفعل ماضياً متعدياً (يحتاج مفعولاً به)، يتم حظر الفاعل بإضافة أداة (ने - ne)، ويُصبح الفعل مجبراً على التصريف والمطابقة مع "المفعول به"! فإذا قرأ الرجل كتاباً (مذكر)، يكون الفعل مذكراً. وإذا قرأ الرجل قصة (مؤنث)، يُصرف الفعل كمؤنث متجاهلاً أن الفاعل رجل! الترجمة العربية ترفض هذا الهيكل تماماً. منصتنا تقوم بعملية تتبع عكسي، حيث تزيل هذه الإرجاتيفية، وتعيد ربط الفعل بالفاعل الحقيقي لإنتاج جملة عربية مبنية للمعلوم بقواعد سليمة.
ترتيب SOV ومستويات الاحترام
تتبع الهندية ترتيب الكلمات (فاعل - مفعول به - فعل) SOV بصرامة. الأفعال توجد دائماً في نهاية الجملة. لترجمة ذلك إلى العربية، نقوم بسحب الأفعال إلى بداية الجملة لتكون جملاً فعلية متينة.
علاوة على ذلك، تتمتع الهندية بنظام دقيق لمستويات الاحترام في الضمائر (تو/توم/آب). الذكاء الاصطناعي يستشعر مستوى "الرسمية" في الخطاب ويقوم بترجمته إما بصيغ جمع الاحترام في العربية (كقولنا "سيادتكم" أو "أنتم")، أو بصيغ المخاطب العادي، محافظاً على السياق الاجتماعي للنص الهندي.