بين إسهاب الماضي للسان العربي وندرته اليوم رقمياً: إعادة رسوخ المحتوى العربي من جديد
لو أن أحد العرب القدامى سمع اسماً مثل اسم الأسد، لتطرق سمعه إلى قسورة وغضنفر وضرغام وهزبر وحيدرة وباسل، وإلى أكثر من ثلاثة مئة اسم يتم بهم تسمية كائن في اللغة الأضخم تاريخياً، العربية التي تضم أكثر من 12.5 مليون كلمة بعدد يفوق 16000 آلف جذر لغوي، تظل طيلة عمرك تستخرج منهم كلمات لا تنتهي حتى تنتهي أنت، أضف إلى ذلك عدد غير محدود من اللهجات العربية سواء القريبة للفصحى أو العامية أو اللهجات العربية التي عرّبّت اللغات الأخرى وابتلعتها بكل سهولة، ولذلك ترى كلامنا محشو كثيراً بكلمات أجنبية قد صِيغت في زيّ عربي جميل، ولا تنسى مدلول الكلمات وما ورائها، ومن بلد إلى بلد ترى عجائب العربية قد فاقت الجمال.
لكن وبالرغم من ضخامة اللغة، إلا أنها تواجه ندرةً في تواجدها الرقمي، إذ لا يزيد محتواها عن 3% من المحتوى الرقمي المتواجد على الأنترنت، واليوم نحاول إعادة هيكلة موضوع غاية الأهمية؛ ندلف لاقتراح بعد اقتراح؛ لأحياء تراث الضاد بين الأصفار الآحاد، ثم نترك الجزء الأخير لتيسير الطريق أمام الذكاء التوليدي لمد يد العون لزيادة المحتوى العربي.
استراتيجيات وحلول لمواجهة ندرة البيانات الرقمية:
مشاريع رقمنة التراث العربي:

فنار (Fanar): نموذج ذكاء اصطناعي توليدي باللغة العربية تم تطويره من قبل معهد قطر لبحوث الحوسبة في جامعة حمد بن خليفة. يمثل إنجازاً متقدماً في مجال الذكاء الاصطناعي المرتبط باللغة والثقافة العربية.

مكتبة الفرقان الرقمية: مبادرة تهدف إلى رقمنة التراث الإسلامي المخطوط، مما يساهم في إثراء المحتوى العربي الرقمي.
مبادرة “بالعربي”: إحدى أبرز جهود المؤسسة لتعزيز حضور اللغة العربية عالمياً، وترسيخ استخدامها بين فئات الشباب على منصات التواصل الاجتماعي، ودعم مكانتها بوصفها أداة للمعرفة والابتكار. والاحتفاء باللغة العربية في يومها العالمي عن طريق التشجيع على استخدام اللغة العربية في جميع وسائل التواصل الاجتماعي: تويتر، وفيس بوك، وانستغرام.
حشد المصادر (Crowdsourcing)
الاعتماد على المتطوعين لإدخال أو تنقيح النصوص العربية، كما في حالة مواقع مثل “ويكي مصدر”، التي تعتمد على المتطوعين لرقمنة الكتب النادرة.
تنمية المحتوى المتخصص
تركيز الجهود على ترجمة المقالات العلمية وتوفير ملخصات ثنائية اللغة (عربي/إنجليزي)، مما يسهم في سد الفجوة في المحتوى العلمي العربي.
المشاريع الوطنية لرقمنة اللغة العربية

ونلقي الضوء على دور المملكة العربية السعودية في صورها المقترحة والأخذة في التنفيذ، حيث:
مجمع الملك سلمان العالمي للغة العربية: يُعدّ المجمع من أبرز المبادرات التي تهدف إلى الحفاظ على اللغة العربية وتطويرها في العصر الرقمي. من بين مشاريعه:
- مركز “ذكاء العربية“: يُعتبر مركزًا متقدمًا في حوسبة اللغة العربية، حيث يضم أكثر من 16 معجمًا، وأكثر من 330,000 مدخل معجمي، وأكثر من 340,000 معنى، وأكثر من 300,000 مثال، وأكثر من 90,000 علاقة دلالية. يستخدم المركز تقنيات الذكاء الاصطناعي لتطوير أدوات لغوية متقدمة.
- معجم الرياض للغة العربية المعاصرة: يُعدّ من أغنى المعاجم بمفردات اللغة العربية المعاصرة، حيث يحتوي على 145,000 معنى يشرح المداخل المعجمية. منذ إطلاقه، شهد إقبالًا واسعًا من المستفيدين حول العالم، وصل عددهم إلى 67,000 مستفيد، وتصدرت السعودية قائمة الدول الأكثر استفادة من المعجم.
ولننتقل بنظرة مطولة بعض الشيء إلى الذكاء الاصطناعي التوليدي، الأداة الأقوى حالياً لزيادة المحتوى، بل كل محتوى. وفيما يلي بعض التطبيقات والمقترحات لاستخدامه في هذا السياق:
- توليد المحتوى النصي:
- تطوير أدوات كتابة ذكية: يمكن استخدام الذكاء الاصطناعي لإنشاء أدوات كتابة ذكية تساعد الكتاب والمحررين في إنتاج محتوى عربي بجودة عالية، مع تحسين الأسلوب اللغوي والتأكد من الدقة النحوية والإملائية.
- توليد مقالات وتقارير: كمايمكنه توليد مقالات وتقارير إخبارية بناءً على بيانات ومعلومات محددة، مما يساهم في زيادة سرعة إنتاج المحتوى وتنوعه.
2. إنشاء المحتوى المرئي:
توليد مقاطع فيديو قصيرة: تشرح مواضيع معينة أو تلخص مقالات، مما يسهل استهلاك المحتوى من قبل الجمهور، لكن هذا يحتاج مجهودات مبذولة في التصميم والعمل.
توليد صور ورسومات: تعبيرية تدعم المحتوى العربي، مما يساهم في جذب انتباه الجمهور وتعزيز التفاعل.
3. تحسين الترجمة والتعريب:
تعريب التطبيقات والمحتوى الرقمي: لتسهيل عملية تعريب التطبيقات والمحتوى الرقمي، مما يساهم في زيادة توفر المحتوى العربي في مختلف المجالات.
ترجمة المحتوى بدقة: يمكن للذكاء الاصطناعي تحسين دقة الترجمة بين اللغات، مما يسهل نقل المعرفة والمحتوى من لغات أخرى إلى اللغة العربية دون الاعتماد على الترجمة الحرفية التي تفقد المعنى.
4. تخصيص المحتوى:
توليد محتوى مخصص للجمهور: يمكن للذكاء الاصطناعي تحليل تفضيلات وسلوكيات المستخدمين لتوليد محتوى مخصص يتناسب مع اهتماماتهم، مما يزيد من التفاعل والاهتمام بالمحتوى العربي.
5. تطوير أدوات تعليمية:
إنشاء محتوى تعليمي تفاعلي: باللغة العربية، مثل الدروس التفاعلية والاختبارات، مما يسهل عملية التعلم ويجعلها أكثر جذبًا للمتعلمين، وأيضاً لتعزيز التعلم باللغة العربية وزيادة محتواه في شرح العلوم.
أمثلة على أدوات الذكاء الاصطناعي التوليدي باللغة العربية:

- علّام (Allam): تطبيق دردشة توليدي من تطوير الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، يمكنه فهم اللغة العربية وإجراء محادثات مع المستخدمين.
- منصة Araby.ai: منصة تقدم أدوات ذكاء اصطناعي مخصصة للغة العربية، بما في ذلك توليد النصوص والصور، مما يسهل إنشاء محتوى عربي بجودة عالية.
من خلال تبني هذه التطبيقات والمقترحات، يمكن تعزيز المحتوى العربي الرقمي وتوسيع نطاقه، مما يساهم في إثراء الفضاء الرقمي العربي وتلبية احتياجات الجمهور المتزايدة.
المصادر:
قائمة أسماء الأسد في اللغة العربية – ويكيبيديا
عن قاعدة البيانات الرقمية | مؤسسة الفرقان للتراث الإسلامي
في يومها العالمي… السعودية تقود جهود حوسبة «اللغة العربية» وترسيخ مكانتها دولياً
الذكاء الاصطناعي واللغة العربية يجتمعان معاً في مشروع قطري|WIRED Middle East
Araby.ai: الثورة في إنشاء المحتوى بواسطة الكاتب العربي الذكي الأمثل
اترك تعليقاً