هل حان الوقت لتتكّلم الآلات باللغة العربية؟

اقرأ بهذه اللغة

Minds and machines

قران جميل بين الأشخاص والآلات. (الصورة من Sdtimes.com)

فاز تطبيقٌ على الأجهزة المحمولة يحقق الأرباح من رقمنة النصّ العربي في مسابقة “الهاكاثون الدولي للعمل الاجتماعي في العالم العربي" International Hackathon for Social Good in the Arab World “الذي استضافته "جامعة نيويورك أبو ظبي"  NYU Abu Dhabi.

هذا التطبيق الذي يحمل اسم "قصاصات" Arabic Snippets، يشكّل مثالاً على تكنولوجيا مصممة لتحسين اللسانيات الحاسوبيّة العربية وهو مجال غير مستغَلٍّ بعد يعجّ بالفرص التجارية المحتملة.

يساعد "قصاصات" على رقمنة الكتب والمستندات باللغة العربيّة من خلال تبسيط عمليّة تحويل النصوص أو الصور الممسوحة ضوئيّاً إلى محتوى رقمي يمكن البحث فيه عن كلمةٍ ما – وهي عمليّة رقمنة أوليّة. ويحقّق "قصاصات" ذلك من خلال عناصر أساسية في "معالجة اللغات الطبيعيّة" NLP وهي نوع من تعلّم الآلات أو الذكاء الاصطناعي.

تسمح أدوات "معالجة اللغات الطبيعية" للحواسيب بفهم اللغات البشريّة، ومنها اللغة العربية، والتواصل بها من دون الاعتماد على الإنسان، في حين أنّ الحواسيب صُمِّمَت للتواصل بلغة برمجةٍ واضحة، ويصعب عليها تفكيك رموز لغات الإنسان الغنيّة بالتعابير العاميّة واللهجات المختلفة.

كيف يمكن "معالجة اللغات الطبيعيّة"؟     

يؤدّي تمكين للحواسيب من فهم وتحليل اللغة العربية إلى فرص تجاريّة مختلفة، إذ أنّ بوسعها تأدية مهمّات معقّدة غالباً ما تكون باهظة الثمن بشكلٍ أسرع من الإنسان. ومن المجالات التي يمكن لـ"معالجة اللغات الطبيعية" أن تبتكر فيها: الترجمة، وتحليل البيانات الضخمة، وجمع الأخبار، والرعاية الصحّية الإلكترونية، وتحليل منصّات التواصل الاجتماعي، والتعرّف على الصوت، والرقمنة.

وعلى المستوى العالمي، يستثمر عمالقة التكنولوجيا مثل "فايسبوك" Facebook و"جوجل" Google ومايكروسوفت" Microsoft في أشكال مختلفة من "معالجة اللغات الطبيعيّة". 

The winning team

الفريق الرابح الذي طوّر تطبيق "قصاصات" في هاكاثون عام 2016 (الصورة من NYUAD)

يستخدم "قصاصات" "معالجة اللغات الطبيعية" في التعرّف على الحروف والكلمات والجمل العربية وتجميعها وإعادة تنظيمها في نصوصٍ كاملة من دون إشراف الإنسان. وبالتالي، لا تحتاج النصوص التي يتمّ مسحها ضوئيّاً إلى رقمنتها يدويّاً كلمةً تلو الأخرى في كلّ مرّة.

يقول نزار حبش، وهو أستاذٌ مشاركٌ يعلّم علوم الحاسوب شارك في فعاليّة "الهاكاثون الدولي" في "جامعة نيويورك أبو ظبي" كمرشدٍ لفريق "قصاصات"، "إنّنا استخدمنا طريقةً بسيطةً للقيام بذلك في الهاكاثون وحصلنا على نتيجةٍ دقيقةٍ بنسبة 98.6%، ونعتقد أنّه بوسعنا تحسين هذه النتيجة مع موارد إضافية لمعالجة اللغات الطبيعية."

لكنّ موارد "معالجة اللغات الطبيعية" المتقدّمة تُعدّ مشكلة، بخاصّةٍ عندما يتعلّق الأمر باللغات المعقّدة مثل اللغة العربيّة.

"حتّى باللغة الإنجليزيّة، لم تحقق ‘معالجة اللغات الطبيعية‘ نتائج فائقة الدقّة بعد"، بحسب مهنّد فرس، المحرّر والشريك المؤسّس لـ"تك بالعربي" TechBel3arabi المنصّة الإخبارية باللغة العربية التي تتناول مواضيع تكنولوجية والتي اختبرت "معالجة اللغات الطبيعيّة" مع الترجمة الآليّة.

يعتقد فرس أنّ "أقرب تكنولوجيا مناسبة للترجمة هي الترجمة الفوريّة من ‘سكايب‘ Skype التي تقدّم نتائج دقيقة بنسبة 60 في المئة،" في إشارةٍ إلى الميزة الجديدة للترجمة الفورية باللغة العربية التي اطلقتها "سكايب" هذا العام.  

يتحدّث حوالي 300 مليون شخصٍ حول العالم باللغة العربيّة، ولكن لم تلقَ هذه اللغة اهتماماً كبيراً بالمقارنة مع اللغات الأخرى في اللسانيات الحاسوبيّة الحديثة، بالرغم من الطلب المتزايد عليها. 

CrowdAnalyzer services

احدى وظائف خدمات "كراود أنالايزر" (الصورة من Crowd Analyzer)

بحسب "جوجل"، تعدّ اللغة العربية من اللغات الخمسة الأكثر استخداماً من بين 32 لغة على خدمة الترجمة التي يقدّمها. ولكن حتّى "جوجل" بحاحةٍ إلى أشخاص طبيعيين وبطيئين لمساعدتها في بناء قدراتها في الترجمة العربيّة. من خلال "مجتمع الترجمة" الخاص بها Translate Community، تعتمد "جوجل" على الملاحظات والترجمة الجماعية من مساهمين متطوّعين لتحسين جودة المنصّة. وتماماً مثل رقمنة النصّ العربي، يمكن لـ"معالجة اللغات الطبيعيّة" وبخاصة العربيّة أن تحسّن هذه العمليّة المرهقة، وبالفعل لقد حان الوقت لابتكارات في هذا المجال.

يقول بهاء جلال، الشريك المؤسّس لـ"كراود أنالايزر" Crowd Analyzer، وهي منصّة تستخدم "معالجة اللغات الطبيعيّة" لمراقبة منصّات التواصل الاجتماعي، إنّ "المحتوى العربي ينمو بشدّة على الإنترنت، ومن المرجّح أن يستخدم المتحدّثون باللغة العربيّة هذه اللغة في نشاطاتهم التكنولوجيّة. وبالتالي، نحن اليوم في أمسّ الحاجة لبناء تقنيّات ‘معالجة اللغات الطبيعيّة‘ وبخاصة العربيّة."

بدوره يذكر حبش في حديثه مع "ومضة" أنّ "هذا المجال شهد أعمالاً كثيرة، لكنّه يتطلّب المزيد منها بعد،" كما ورد في كتابه عن هذا الموضوع. أمّا "إذا استخدم تطبيق ‘قصاصات‘ بكثرة، فسوف يساهم ذلك في جمع مجموعات كبيرة من البيانات يمكن استخدامها لبناء نظم أفضل."

فالتطبيقات مثل "قصاصات" لم تتعمّق بعد وتغوص في كلّ ما يمكن لهذا المجال تقديمه.

مشهد معالجة اللغة العربيّة

منذ تأسيسها عام 2013، تساعد "كراود أنالايزر" الشركات في مراقبة وتأدية الأبحاث وتحليل ما يحصل على وسائل التواصل الاجتماعي.

ووفقاً لجلال، "اعتمدت ‘كراود أنالايزر‘ على معالجة اللغة العربيّة لبناء منصّةٍ لمراقبة وسائل التواصل الاجتماعي، وذلك بعد دراسة اللغة العربيّة وديناميكيتها لتطوير شكلٍ فعليّ من الذكاء الاصطناعي الذي يمكنه فهم اللغة العربيّة كما يفهمها الإنسان."

وعن هذه المنصّة التي يمكنها أن تفهم النصوص الإنجليزية والعربيّة تلقائيّاً فيما يتعلّق بالصِّلة واللهجة والشعور، يقول جلال إنّ بإمكانها معرفة ما إذا كان الشخص الذي يشارك رأيه على منصّة التواصل الاجتماعي سعيداً أو حزيناً أو محايداً تجاه الموضوع الذي يتكلّم عنه.

وفي المحصّلة، تستخدم "كراود أنالايزر" البيانات التي تجمعها لإنتاج نصائح شخصيّةٍ وخاصّةٍ لكلّ عميلٍ لديها. 

Sakhr software timeline

الجدول الزمني لبرمجيّة "صخر" (الصورة من "صخر")

من جهة أخرى، يشهد عالم الترجمة نشاطاتٍ أخرى مثل "كرّاس" Curras ، بوابة الترجمة التي أنشأتها وطوّرتها "جامعة بيرزيت" Birzeit University في فلسطين للمساعدة في بناء تطبيقات تكنولوجيا المعلومات للترجمة الآليّة والبحث والتدقيق الإملائي والتعرّف على الصوت.

زمن الشركات العاملة في هذا المجال أيضاً شركة "صخر" Sakhr الكويتيّة التي أطلَقَت منذ عام 1982 برمجيّةً للترجمة الآلية باللغة العربية والتعرّف على الصوت وتركيبات الكلام والتعرّف الضوئي على الحروف.

أمّا على المستوى العالمي، فالشركة الناشئة التي تعنى بالرعاية الصحّية الإلكترونية والكائنة في الولايات المتحدة، "أكس 2 إيه آي" X2AI، لجأت إلى معالجة اللغات الطبيعية وتحديداً اللغة العربية لإنشاء برنامج دردشة للتفاعل بشكلٍ شخصي في محادثات مع اللاجئين السوريين لمساعدتهم على التأقلم مع الصدمات النفسيّة والعاطفيّة. ولهذا الأمر، تعاونت "أكس 2 إيه آي" مع منظمة "فيلد إنوفايشن تيم" Field Innovation Team غير الحكوميّة التي توصل المساعدات الإنسانيّة التكنولوجيّة، من أجل توزيع برنامج الدردشة على اللاجئين ومساعدة العاملين في منطقة الشرق الأوسط وشمال أفريقيا.

وهناك أيضاً مترجم "سكايب" المذكور آنفاً، والذي يستخدم أدوات معالجة اللغات الطبيعية وبالتحديد اللغة العربية لترجمة المحادثات والرسائل المباشرة بين اللغة العربية واللغات الأخرى. ولكن حاليّاً، لا يعمل مترجم "سكايب" إلاّ باللغة العربية الفصحى الحديثة.

تحدّيات كثيرة

رغم استخداماتها المختلفة، لا تزال تكنولوجيا معالجة اللغات الطبيعيّة وتحديداً اللغة العربية بحاجةٍ إلى الوقت والصبر.

في هذا الإطار، تعرّب منصة "تك بالعربي" للأخبار التكنولوجيّة غالباً المصطلحات التقنيّة بتفسيرات عوضاً عن ترجمتها حرفيّاً. ويقول مؤسِّسها، مهنّد فرس: "لقد حاولنا استخدام معالجة اللغات الطبيعية التي تكون في بعض اللغات دقيقة إلى حدّ 70%، إلا أننا لسنا محظوظين بهذا الأمر [مع اللغة العربية]."

مساعيهم في استخدام معالجة اللغات الطبيعيّة لترجمة المقالات بالكامل نتج عنها نصوصاً غير مقروءة، ويلفت فرس إلى أنّه لم يفهم "ولا حتّى 10% من المقال. ورغم أنّنا نسعى لاكتشاف [وسائل أخرى] دائماً، إلا أنّنا نعتمد كلّياً على الترجمة اليدويّة والكثير من المراجعات."

اقرأ بهذه اللغة

شارك

مقالات ذات صِلة