الدرس الرابع والخامس : مشكلات اللسانيات الحاسوبية العربية والحلول المقدمة لها

قبل البدء في عرض رؤيتي لحل مشكلة حوسبة اللغة العربية أذكر هنا نموذجاً اقترحه د.وجدان ليكون منهج اللسانيات الحاسوبية.
-
اقتراحات د.وجدان[1]:
  فيما يلي تفصيل يقدم تصوراً تأسيسيا لمنهجية التناول تتعدد فيه المقاربات تبعا لتباين الأنظمة اللغوية الجزئية التي تتكامل فيما بينها وتشكل تلك الأنظمة مجتمعة النظام الكلي للغة العربية
- توصيف النظام الفوناتيكي:    تؤول العربية في نظامها الصوتي إلى أربعة وثلاثين فونيما ثمانية وعشرون صامتا تتمثل في حروب الأبجدية العربية وستة صوائت تمثلها الحركات الثلاث القصيرة الفتحة والكسرة والضمة والحركات الثلاث الطويلة حروف المد ويعنى في الجانب الفوناتيكي بتوصيف تلك الأصوات آحادا على المستوى الأكوستيكي الفيزيائي...والبادي أن توصيف الأصوات منفردة على هذا النحو سيفضي إلى نتائج دقيقة لا تقبل اللبس وأن حدوداً فاصلة قاطعة ...ستميز كل صوت عن بقية الأصوات .
- توصيف النظام الفونولوجي:   تخضع الفونيمات العربية لقواعد فونولوجية تحكم تتابعها في سياق الكلمة أو الجملة وقد يطرأ على الفونيم تغيير في صفته تأثراً بما يسبقه أو ما يليه من الفونيمات ويعني ذلك أن التوصيف الفوناتيكي لأصوات العربية لا يكفي وحده ليمكن الحاسوب من تمييز الفونيمات وأنه يحتاج إلى توصيف آخر لما يعتري فونيمات العربية في سياقها الوظيفي (التضعيف - التجانس والإدغام - ال الشمسية)
- توصيف النظام المورفولوجي:   ينبغي ابتداءً أن نلمح إلى أن توصيف النظام المورفولوجي يهدف إلى تمكين الحاسوب من التعامل مع المورفيمات الوحدات الصرفية التي تشكل التراكيب اللغوية المتنوعة وينبغي ونحن في هذا الصدد التمييز بين مطلبين متمايزين المطلب الأول المتمثل في القدرة على التوليد أي صوغ الأبنية اللغوية السليمة بخطوات إجرائية محددة على نحو شامل مستقص والمطلب الثاني الذي يمكن الحاسوب من التحليل بتعيين المعاني الصرفية وتفكيك التراكيب اللغوية إلى وحداتها الصرفية الصغرى حين ترد في سياق الجملة أو في سياق النص.
- توصيف النظام الإعرابي:    يلزمنا بادئ الأمر تصنيف كلم العربية إلى المبني والمعرب ذلك أن المبني سيستدخل في الحاسوب على هيئة لا تتغير ...وسيفضينا ذلك إلى حصر جهدنا على الاسم المعرب والفعل المعرب.
- توصيف النظام الدلالي:    يمثل توصيف النظام الدلالي للغة العربية نواة المعالجة الآلية وعموده الفقري ذلك أن جل عمليات المعالجة الآلية للتراكيب اللغوية تستند بشكل من الأشكال عليه وتحيل إليه ويعد عند المعنيين باللسانيات الحاسوبية أعسر المباحث تناولا لتعلق دلالات الألفاظ بداهة بالفهم البعيد المنال عن الحاسوب ...ولعل الأولى ونحن في سبيل إنشاء هذا النظام الدلالي أن نستعين ببنك للنصوص العربية الفصيحة يتم اختيار نصوصه سلفا وفق معايير علمية يرتضيها المتخصصون في العربية.
-وصف خصائص اللغة العربية الخط والتشكيل النحو الدلالة:
  تتميز اللغة العربية بالعديد من الخصائص التي تشرفها على غيرها من اللغات ونذكر هنا ما له علاقة بعملية الحوسبة فمنها:
أنها لغة معربة، واشتقاقية، غنية بالمفردات، وفيها أكثر من نوع من الجمل، ويمكن التقديم والتأخير لأركان الجملة، والتعبير عن المعنى الواحد بصياغات عديدة، ويكثر في أساليبها الاستعارات والإنزياحات اللغوية، ويتميز الخط العربي بالإيجاز في استخدام الحروف فمن ذلك الاكتفاء بحرف واحد عندما يتكرر نفسه متتاليا مثل: "داود" و "يحي" وتحذف ياء المتكلم في كثير من المواضع مثل: "يا رب" و "يا قوم" وكون الحرف له عدة أشكال تختلف في حال الاتصال والانفصال، وأهم من ذلك التعبير عن الصوائت القصيرة بأشكال صغيرة توضع على الحروف ليس كباقي اللغات التي تعبر عنها بمحارف خاصة.
  وهذه الخصائص تعطي للغة غنى تعبيريا واسلوبيا يشرفها ويرفع منزلتها مقارنة باللغات الأخرى، لكن بالنسبة للآلة تشكل هذه الخصائص تحدياً وصعوبة في إدراكها ومعالجتها
وذلك لأن الحاسوب له خصائصه التي سنعرضها الآن ونوضح لماذا تشكل خصائص اللغة تحدياً له.

- خصائص الحاسوب
السعة الكبيرة: وقد مرت بمراحل عديدة حتى صار بالإمكان تخزين الكم الهائل من المعلومات والبيانات والملفات باختلاف أنواعها على شريحة صغيرة لا يتجاوز حجمها ظفر الإصبع.

 المعالجة السريعة: قد تكون هذه الميزة أهم خصائص الحاسوب وهي التي كان لها الدور الأكبر في التفجر المعرفي ولطالما تفاخر الناس على أقرانهم بتطور هذه الميزة في حواسيبهم الشخصية.

الخوارزميات: يعتمد الحاسوب في أداء وظائفه على خوارزميات ومعادلات تنظم خطوات تعامله مع الأوامر والبيانات والملفات وتكون هذه الخوارزميات قد أعدت مسبقاً ووضعت في نظام الحاسب كما يوجد لكل برنامج خوارزميات خاصة به تتناسب مع المهمة التي أعد لها لذلك يمكن وصف نظام الحاسوب بأنه نظام رياضي.
وهناك صفة أخرى للحاسوب ينبغي التنبيه لها كي نتعامل معه بطريقة صحيحة وهي أنه غبي او عاجز عن الفهم.
وذلك أنك عندما تعرف الاسم بأنه ما كان مثل رجل فرس حائط فإن الإنسان يقيس عليه كل أسماء العربية التي تعبر عن الموجودات لكن هيهات للحاسوب أن يدرك ذلك ولا سبيل إلا بعملية إحصائية تنص على وصف كل الكلمات الدالة على اسم بأنها اسم وإدراجها في الحاسوب
-اقتراح المنهج الأنسب:
  إن أنسب المناهج في عملية حوسبة اللغة العربية هو المنهج الذي يراعي الخصائص التي ذكرناها لكل من اللغة العربية والحاسوب لأن ذلك سيقودنا إلى وضع الخوارزميات المعبرة عن الوقائع اللغوية والتي يستطيع الحاسوب معالجتها.
والمنهج يجب أن يكون كالآتي:
   اتباع ما اقترحه الدكتور وجدان في أولاً وثانياً أي توصيف النظام الصوتي والنظام المعجمي للغة العربية بما يناسب الحاسوب وبعد اطلاعي على جهود محمد مراياتي أرى أن يكون جهده في التوصيف للنظام الصرفي هو المرحلة التالية بالإضافة لما قدمه الدكتور نبيل علي في هذا المجال، أما بعد ذلك فلا بدّ من تزويد الحاسوب بكم هائل من النصوص العربية المشكولة بالكامل القابلة للمعالجة "بنك نصوص لغوية" قبل البدء بالتوصيف الإعرابي النحوي والإملائي والدلالي، وذلك بغية تسهيل عملية وضع الخوارزميات وتوصيفها لتكون مطردة وسهولة كشف ثغرات الخوارزمية لتعديلها وتجاوزها.
ونضرب مثالاً على ذلك بقاعدة التقاء الساكنين إذ سنعطي إرشادا للحاسوب أنه عندما يلتقي ساكنان سيحذف الساكن الأول ونعطيه مثالاً:
سعت = سعى +ت
ثم نعطيه أمراً بالبحث عن مواضع التقاء الساكنين في النصوص المدخلة فيه من قبل
فيخرج لي كلمة "الضالّين" مثلاً فأعدل على الخوارزمية ذلك بشرط أن لا يكون الحرف الثاني مضعفا.ويخرج لي أيضاً تركيب "عهدي الظالمين" فأضيف للقاعدة إذا كان الساكنان في كلمتين فإنه يحذف لفظا ويبقى رسما.وبهذا يكون توصيف القاعدة شاملاً.
  ويلاحظ أني لن أحتاج توصيف حالات التخلص من التقاء الساكنين بالتحريك لأن الحاسوب أصلاً لن يعترض عليها إذ أدخلت فيه خالية من التقاء الساكنين.
وبهذا الطرح أكون قد وفرت وقتي في استقصاء حالات التقاء الساكنين وإدخالها في واحدة واحدة وتجنبت ما قد ألقاه من تناقض وصعوبة في التوصيف والتفريق بين واو الجماعة التي نحركها عند التقاء الساكنين بالضم ونحذفها لفظا أو كتابة ولفظا إذا كانت غير واو الجماعة
الأمر الذي سيضطرني إلى وضع توصيف للواوات ومتى تكون جماعة أو أصلية أو غير ذلك ثم توضيح الحالات المشتركة، ثم أعود إلى قاعدة التقاء الساكنين، وأضع لها التوصيف المناسب إذا استطعت الانتهاء من الحالات الاستثنائية والخاصة.ويظهر من الذي ذكرته تناسب الطريقة التي ذكرتها مع خصائص الحاسوب وخصائص العربية فقد استفدت من سعة الحاسوب الكبيرة ومعالجته السريعة، وتخلصت من تعدد احتمالات دلالة الكلمة على فعل أو اسم أو ماض وأمر باعتمادي النصَ المشكولَ وكمّا هائلاً من النماذج والوقائع اللغوية مما يجعل وجود تعبير مخالف لما قعدته نادراً جداً
فما هي أسس هذا المنهج؟
أولاً: الاستفادة من الجهود المبذولة في دراسات النظام الصوتي والمعجمي للغة العربية مع التأكيد على وضع رمز لتصنيف الكلمة كاسم أو فعل أو حرف وربما احتجنا بعض التصنيفات الفرعية كضمير واسم إشارة واسم موصول أيضاً  كما هو موجود في القواميس الإنكليزية.
ثانياً: اعتماد النص المشكول بالكامل قبل البدء بعمليات التوصيف وذلك لأن الحركات في العربية تعادل حروفا مرسومة في غيرها.

ثالثاً: تخزين كم هائل من النصوص العربية المشكولة بالكامل القابلة للمعالجة بنك نصوص لغوية في ذاكرة الحاسوب.

رابعاً : البدء بالتوصيف الصرفي والنحوي والإملائي مستفيدين من الجهود السابقة والبناء عليها.
خامساً : أرى أن توصيف المستوى الدلالي سيظل التحدي الكبير في وجه اللسانيات الحاسوبية وربما يقدم نحو النص مساعدة وتيسيرا في هذا المجال إذا تطور أكثر، لكني أنبه لعملية مفيدة جداً في هذه الناحية بعد أن صار متوفراً عندي كمّ هائل من النصوص العربية المشكولة
وهي عملية مقاطعة النصوص مع بعضها البعض مما يتيح للحاسوب معرفة كيفية اصطفاف الكلمات في الأساليب العربية ونماذج عديدة لصياغة العبارة العربية، لنفيد من ذلك في توصيف المستوى الدلالي.
   ولا بدّ قبل ختام هذا الفصل من الحديث عن ربط الجهود السابقة والاستفادة من جهود مبذولة في مجالات أخرى حيث أرى أنّ أولاً وثانياً قد صارا جاهزين بفضل الجهود السابقة ولا تحتاج إلاّ بعض التكملات وتنسيقها معاً لخدمة هذا المنهج ولعل سائلا يسأل: كم سنة تريد حتى ننجز بنك النصوص اللغوية المشكولة؟ ألست تبالغ في هذا المقترح؟ والجواب: أنه جاهز بفضل جهود العاملين على توفير الكتب بطلاب العلم ضمن برامج وتطبيقات تساعدهم على البحث وأخص هنا "المكتبة الشاملة" لأنها تقدم لك النص مشكولا وبدون تشكيل ولا يجهل من سمع باسمها فقط ضخامة الملفات والنصوص التي تحويها فعندما نضم هذا الجهد للجهود السابقة ونطبق ما اقترحته من خطوات سنحصل على نتائج قيمة جدا.



[1] اللسانيات الحاسوبية العرببة - المنهج والإطار، وحدان محمد صالح كنالي – بحث قدم في المؤتمر الدولي الثاني للغة العربية في دبي – 30/ جمادى الآخرة/ 1434 – ص10 وما بعدها.