الصينية (المبسطة): الرموز الصامتة وهيكلة الكلمات المساعدة
اللغة الصينية الماندرين (中文) هي اللغة الأكثر تحدثاً كلغة أم في العالم، وتقف في أقصى طيف التعقيد البصري والنحوي مقارنة باللغات السامية أو ההندو-أوروبية. العقبة الأولى والأضخم هي نظام الكتابة؛ الصينية لا تستخدم الحروف الأبجدية، بل تعتمد على "الرموز أو اللوجوغرامات" (Hanzi)، حيث يمثل كل رمز معنى أو كلمة مستقلة بحد ذاتها (مثال: 人 تعني إنسان، 木 تعني شجرة). المشكلة البرمجية هنا هي أن الصينية تُكتب ككتلة صماء من الرموز دون مسافات لتفصل بين الكلمات! محرك FrancoTranslate يعتمد على خوارزميات "التجزئة الدلالية" (Semantic Tokenization) المتقدمة. هذه الخوارزميات تقرأ الرموز المتتالية وتحدد أين تنتهي الكلمة المكونة من رمزين أو ثلاثة، لتمنع الترجمة الحرفية الكارثية لكل رمز على حدة، مما يضمن خروج الجملة بدلالاتها الصحيحة المتكاملة.
من الناحية النحوية، الصينية المبسطة لغة "عازلة" تماماً (Isolating). هذا يعني أنه لا توجد أية تصريفات أو تغييرات تطرأ على الرموز؛ لا توجد أزمنة (ماضٍ أو مضارع)، لا يوجد جمع للكلمات، ولا يوجد تذكير وتأنيث نحوي، والرمز يبقى ثابتاً لا يتغير شكله. لمعرفة أن الفعل وقع في الماضي، يكتفي الصينيون بإضافة جزيئات مساعدة (مثل: 了 - le) بعد الفعل، أو إضافة كلمات زمانية صريحة كـ "أمس". ولجمع الأشياء، لا يغيرون الكلمة بل يضيفون الكلمة المساعدة (们 - men) للضمائر فقط. اللغة العربية في المقابل لغة مبنية كلياً على التصريفات وتغير البنية الداخلية للكلمات. لذا يقوم نظام الذكاء الاصطناعي بامتصاص الجزيئات الزمانية الصينية، وتحويل الفعل العربي إلى الماضي أو المستقبل (كتب، سيكتب)، كما يستنتج الجنس والجمع من سياق النص ليخضع الأفعال لقواعد المطابقة والتذكير والتأنيث العربية اللازمة.
كلمات القياس (Classifiers) والجمل الموجهة بالموضوع
في الصينية، لا يمكنك عدّ الأشياء مباشرة (لا يُقال: 3 أشخاص). يجب وضع "كلمة قياس" (Measure word) بين الرقم والاسم، مثل كلمة (个 - gè). الترجمة العربية الفصيحة تسقط كلمات القياس هذه، ليُترجم النص ببساطة إلى "ثلاثة أشخاص"، متجنبين الحشو الغريب.
علاوة على ذلك، الصينية لغة "موجهة بالموضوع" (Topic-prominent). الجملة لا تبدأ بالفاعل دائماً، بل تبدأ بأهم معلومة في السياق، ثم يتبعها تعليق. خوارزمياتنا تعيد بناء هذا الهيكل ليصبح متوافقاً مع المنطق العربي، محولين الجملة إما لجملة اسمية بليغة (المبتدأ والخبر) أو جملة فعلية قوية.