الدرس الحادي عشر والثاني عشر : استثمار اللسانيات الحاسوبية في مشروع الذخيرة اللغوية العربية
مشروع الذخيرة العربية
هو مشروع عربي ستشرف عليه المنظمة العربية للتربية والثقافة والعلوم. والهدف منه هو إنشاء بنك إلكتروني لللغة العربية المستعملة بالفعل وعمل معجم إلكتروني فيه اللغة العربية في الكلمات المرادفة لها في اللغة الإنجليزية والفرنسية. ويرأس هذا المشروع الدكتور عبد الرحمن حاج صالح. [1]
الغرض من الذخيرة اللغوية
نشأت فكرة مشروع الذخيرة العربية من فكرة الاستعانة بالكومبيوتر (الحاسوب) واستغلال سرعته الهائلة في علاج المعطيات وقدرته العجيبة في تخزين الملايين من هذه المعطيات في ذاكرته، لإنشاء بنك آلي من المعطيات يحتوي على أهم ما حرّر بالعربية مما سينتجه على مرّ السنين.
وسيكون هذا البنك الآلي تحت تصرف أي باحث في أي مكان في العالم فيمكنه أن يسأل الحاسوب عما يشاء من المعلومات فيجيبه بسرعة الضوء. ونحن نعرف أن الباحث –واللغوي خاصة- قد يقضى الشهور بل والسنين الطوال في قراءة الأسفار الكثيرة من الكتب حتى يعثر على بغيته .
وقد شرعت بعض المؤسسات العربية في تخزين بعض النصوص العربية وذلك مثل القرآن الكريم وكتب الحديث والشعر الجاهلي. فالذي نرجوه هو أن يعمم ذلك على نطاق واسع في الوطن العربي. فالذخيرة اللغوية العربية هي إذن بنك آلي من النصوص القديمة والحديثة (من الجاهلية إلى وقتنا الحاضر). وأهم صفة تتصف بها هي سهولة حصول الباحث على ما يريد، وسرعته ثم شمولية المعلومات التي يمكن أن يحصل عليها وأهم من هذا أيضاً اشتمالها على الاستعمال الحقيقي للغة العربية عبر العصور وعبر البلدان العربية المختلفة.
أهذاف المشروع:
يرمي مشروع الذخيرة اللغوية العربية إلى إنجاز:
o بنك آلي للغة العربية المستعملة بالفعل (بنك نصوص.
o معجم آلي جامع للغة العربية مع المقابل الفرنسي والإنكليزي يستخرج من البنك الآلي المذكور (معجم مفردات)[2]
مواصفات المشروع:
سينجز البنك الآلي (أو الحاسوبي) للمعطيات النصية انطلاقا من الاستعمال الحقيقي للغة العربية ليضم:
- المؤلفات ذات القيمة الكبيرة في الآداب والعلوم والتكنولوجيا وغيرها، القديمة منها والحديثة.
- المحاضرات الجامعية القيمة المنشورة.
- المقالات ذات القيمة المنشورة في المجلات الأدبية والعلمية والبحوث القيمة المعروضة في الندوات والمؤتمرات والموائد المستديرة وغيرها.
- جميع المعاجم العربية والمزدوجة اللغة القديمة والحديثة (مثل لسان العرب والمعجم الكبير الحديث وغيرهما)؛ والغرض من بنك النصوص الآلي هو أن يكون قاعدة معطيات دائمة بحيث تقبل الزيادة والتصحيح على الدوام بسبب تطور المعلومات من خلال الاستعمال الحقيقي للغة العربية وبالتالي أن تصير المصدر الأساسي لإنجاز المعجم الجامع للغة العربية الذي سيحرره العلماء وخاصة أعضاء المجامع العربية وإنجاز العدد الكبير جدا من الدراسات والبحوث في اللغة العربية، زيادة على ذلك.
والذي يميز هذه الذخيرة اللغوية عن الذخائر التي أنجزت في الزمان الحاضر كذخيرة اللغة الفرنسية مثلا هو في وجود هذا البنك الآلي للنصوص العربية السابق الذكر وكونه بنكا مفتوحا غير مغلق بل قابل للزيادة والتصحيح. وسيكون بفضل شبكة اتصال دولية عربية تحت تصرف أي باحث في العالم في أي وقت أراد ويمكن أن تضاف إليه كل الزيادات الممكنة وأن تدخل فيه كل النصوص ذات الأهمية على الدوام وبدون انقطاع.
فوائد المشروع:[3]
إنّ أهم ما تختص به الذخيرة اللغوية العربية هو أنها تتناول الاستعمال الحقيقي للغة العربية كما سبق أن قلنا، من أقدم العصور حتى العصر الحاضر. فالنصوص –أو السياقات- هي التي ينبغي أن يعتمد عليها لتحديد معاني المفردات ولا يكتفى في ذلك بالمعاجم الموجودة.
ثم إن ما سيترتب على ذلك من المنافع هو شئ عظيم كما يصرح بذلك الذين سيساهمون في إنجازها أنفسهم لأن البحث عن مفردة أو صيغة أو بنية تركيبية أو عبارة جامدة أو أي شئ يخص اللغة في نص واحد أو عدة نصوص قد يتطلب زمناً طويلا جدا وقد يقضي الإنسان عمره في البحث عن هذه الأشياء ولا سيما بالنسبة للنصوص التي لم تفهرس وحتى المفهرسة منها فقد لا تفي بكل ما يطلبه الباحث. وسرّ الذخيرة أنها فهرسة كبيرة شاملة لكل ما أنتجه الفكر العربي منذ الجاهلية إلى يومنا هذا. أضف إلى ذلك أنها آلية وسرعة العثور فيها على ما يطلبه الباحث هي في سرعة الضوء. كما يمكن أن نعرف بالضّبط المعاني التي قصدها المستعملون للغة العربية عبر العصور من سياقات الكلمات وهذا متعذّر على الباحث الأعزل الذي لا يستعين بالأجهزة الحديثة.
لا ينبغي أن يعتقد الباحث اللغوي أن هذه الذخيرة وهذا المعجم يلغيان الأعمال العظيمة التي ينجزها العلماء. فالذخيرة هي هذه الأعمال نفسها وليس فيها إلا ما يحرره العلماء. فالجديد فيها هو فقط اللجوء إلى الوسائل الآلية الجبارة واستغلالها كما تستغل حاليا في جميع الميادين التي تعالج فيها المعلومات.
- الاعتماد في وضع المصطلحات والبحث عنها على كل المعطيات اللغوية في ميدان معين من واقع استعمال اللغة العربية قديما وحديثا. فالمتخصص الذي قد يحتاج إلى أن يضع مصطلحا معينا لا يجده فيما لديه من المراجع لمفهوم معيّن تجعل الذخيرة أمامه في بضع ثوان كل الألفاظ التي استعملت عبر العصور أو تستعمل الآن بالفعل عبر البلدان من تلك التي ينتمي إليها ذلك المفهوم. فهو لا يرجع بذلك إلى القواميس وقوائم المصطلحات التي اقترحت فقط (وربما لم تدخل بعد في الاستعمال) بل إلى الاستعمال الحقيقي في شتى البلدان العربية.
- الاعتماد في اختيار اللفظ على مقياس الشيوع والدقة في دلالة المعنى المراد ويستطيع المتخصص أيضا أن يعرف مع ذلك درجة شيوع هذه الألفاظ قديما وحديثا ثم يعرف مدلولها الحقيقي لا من التحديدات فقط بل من جميع السياقات التي وردت فيها في الاستعمال وهي أمثل الطرق لتحديد معاني الألفاظ وأكثرها موضوعية. وفوق كل هذا فأنه يحصل على كل هذا في بضع دقائق.
- الاعتماد على هذا البنك النصي الآلي في البحث عن التطور الدلالي للألفاظ العربية ومن ثم إمكان وضع معجم تاريخي دقيق للغة العربية.
- إمكان الفهرسة الآلية لكل النصوص العربية ذات القيمة العلمية والأدبية مما طبع وما يطبع وينشر على مستوى الوطن العربي (المصطلحات، الألفاظ الحضارية، بيان تردّد كل لفظة في النص الواحد، الأعلام ...
- إقامة الدراسات العلمية المقارنة في مختلف الميادين حول مجموعة معينة من المفاهيم العلمية.
- البحث المنتظم عن تطور الفكر العلمي العربي بالاعتماد على تطور دلالات الألفاظ العلمية داخل حقول دلالية عبر الزمان.
- إمكان وضع معجم شامل للغة العربية المستعملة بالفعل تخصص لكل مدخل فيه دراسة لغوية دقيقة، وغير ذلك من الفوائد.
حوسبة الذخيرة اللغوية[4]
إن الصفة الأساسية لبنك النصوص هو أنه آلي وهذا يستلزم القيام بحوسبة هذا البنك أي أن يوضع له ما يسمى بالقوام البرمجي وهي مجموعة البرمجيات التي لا بد منها لاستثمار الذخيرة (إلقاء أسئلة على الحاسوب). وهذا القوام هو في الواقع نظام (نسق) لتسيير قواعد المعطيات التي هي نصوص بالنسبة للذخيرة. وتجري الآن بحوث مكثفة في الوطن العربي فيمـا يخص هذه البرمجيات ونذكر مثلا :البحوث الحاسوبية الخاصة بتنظيم التخزين للمعلومات وهي أهمها وبحوث تخص حيازة النصوص (إدخالها في ذاكرة الحاسوب) بكيفية آلية (المسح الضوئي)
إنجاز المعجم الآلي الجامع للغة العربية
سيتكفل بذلك العلماء بعد إنجاز الجزء الكبير من البنك الآلي.
وظائف الذخيرة الأساسية
- تحصيل معلومات تخص الحدثة العربية عادية كانت أومصطلحا.
الأسئلة التي يمكن حتى يطرحها الباحث: * هل توجد حدثة (س) الآن في الاستعمال (المكتوب أوالمنطوق أوكليهما)،يا ترى؟ وأين ظهرت وفي أي معنى في جميع واحد من مصادر وجودها،يا ترى؟ وما هي السياقات التي وردت فيها بالنسبة لكل كتاب أونص أوبالنسبة لكل عصر أوجميع بلد؟ * هل وردت (س) قديما مع نفس الاسئلة السابقة؟ * ما المجال المفهومي الذي تنتمي إليه (س)،يا ترى؟ وهل لها مرادفات وما هي،يا ترى؟ ثم ما المقابـل أواللقاءات لأول مرة بالمعنى الفلاني أوبأي معنى آخر،يا ترى؟ ومتى اختلفت لآخر مرة إذا خرجت عن الاستعمال بهذا المعنى أوبغيره من المعاني،يا ترى؟ الخ.
- تحصيل معلومات تخص الجذور وصيغ الحدث: * هل وردت المواد الأصلية ا ب ج د… في الاستعمال عند مؤلف أومتحدث خاصة،يا ترى؟ وما هي الحدثات التي صيغت عليها واستخدمها هذا المؤلف؟ * نفس السؤال بالنسبة إلى الصيغ أَ بَ جَ دَ… * اذكر جميع الحدثات التي صيغت على صيغة (أ) أو(ب) أو(ج) أو(د) مع الإشارة إلى مدلول جميع حدثة من هذه الحدثات (صيغة عملة بضم الفاء وسكون العين أوفعالية بفتح الفاء وغير ذلك.
3- تحصيل معلومات تخص أجناس الحدث * ما هي أسماء الأعلام أوالمصادر أوالأفعال الثلاثية أوالرباعية المجردة والمزيدة (وغيرها) والصفات الخاصة بمجال مفهومي (الألوان والعيوب وأي حلية) وغير ذلك من أجناس الحدث الواردة في نص معين أوعدة نصوص وعبر الزمان؟ * ما تردد جميع واحد منها بالنسبة إلى نص واحد أوعدة نصوص؟ وما هي >سياقاتها؟
- تحصيل معلومات تخص حروف المعاني نفس الأسئلة أوبالنسبة إلى عصر واحد أونص واحد أوعدة نصوص.
- تحصيل معلومات تخص المعرّب عامة الذي ورد في الاستعمال أسئلة عن قائمة المعرّبات (ومبادئها) التي وردت في عصر معين أومؤلف أوعبر العصور.
- تحصيل معلومات تخص صيغ الجمل والأساليب الحية والجامدة منها (والصور البيانية العربية) نفس الأسئلة.
- تحصيل معلومات تخص بحور العروض والضرورات الشعرية والزحافات والقوافي وغيرها.وغير ذلك من الأسئلة.
- تحصيل معلومات تخص المفهوم الحضاري أوالفهمي (البحث عن ألفاظ عربية لتغطية مفاهيم فهمية): *هل توجد حدثة عربية للدلالة على مفهوم معيّن خاص بالطب أوالبيطرة أوالهندسة المعمارية أوغير ذلك، المعبر عنه بالإنجليزية أوالفرنسية بكذا، في الإنتاج الفهمي العربي المعاصر؟
* هل يوجد هذا المفهوم وما يقاربه في نص قديم معيّن (كتاب من خط ابن سينا أوابن الهيثم…) وذلك من خلال الحدثة العربية التي اتىت في الجواب السابق،يا ترى؟ ( يمكن على هذا حتى نتبين الفوارق الدلالية بين مفهوم الحدثة العربية عند القدماء والمفهوم الحديث بالسياقات).
[1] عبد الرحمن الحاج صالح، بحوث ودراسات في اللسانيات العربية ،ج1،دار موفم للنشر،2012،ص396
[2] المصدر السابق،ص396
[3] المصدر السابق،ص398
[4] المصدر السابق،ص400
- معلم: نسيمة شمَــــام