النهار

60% من الباحثين الذين طوّروا النموذج عرب... بوساحة لـ"النهار": فالكون 2 الإماراتي يحمي حضارتنا
المصدر: "النهار"
حجزت دولة الإمارات العربية المتحدة مقعداً لها في الصفوف الأمامية في سباق الذكاء الاصطناعي (AI) من خلال إطلاق أحدث نموذج لغوي كبير – LLM (large language model) وهو Falcon 2 الذي طوره معهد أبو ظبي للابتكار التكنولوجي TII كمنافس جدي لـMeta AI وOpenAI. ويتميّز بقدرات متقدمة وإمكانية وصول مفتوحة المصدر. لذا يمكن لأي شخص استخدامه وتحسينه، ما يجعل مستقبل الذكاء الاصطناعي أكثر إشراقاً! كما يوفّر خدمة وصف الصورة، وهي غير متوفّرة في نماذج chat gpt وGemini، التي تكتفي فقط بخلق صورة من وصف وليس العكس.
60% من الباحثين الذين طوّروا النموذج عرب...
بوساحة لـ"النهار": فالكون 2 الإماراتي يحمي حضارتنا
صورة تعبيرية.
A+   A-
 
باولا عطية

حجزت دولة الإمارات العربية المتحدة مقعداً لها في الصفوف الأمامية في سباق الذكاء الاصطناعي (AI) من خلال إطلاق أحدث نموذج لغوي كبير – LLM (large language model) وهو Falcon 2 الذي طوره معهد أبو ظبي للابتكار التكنولوجي TII كمنافس جدي لـMeta AI وOpenAI. ويتميّز بقدرات متقدمة وإمكانية وصول مفتوحة المصدر. لذا يمكن لأي شخص استخدامه وتحسينه، ما يجعل مستقبل الذكاء الاصطناعي أكثر إشراقاً! كما يوفّر خدمة وصف الصورة، وهي غير متوفّرة في نماذج chat gpt وGemini، التي تكتفي فقط بخلق صورة من وصف وليس العكس.
 
وفي هذا الإطار تواصلت "النهار" مع الدكتورة بسمة الأمل بوساحة، في معهد أبو ظبي للابتكار التكنولوجي TII، والتي شرحت في حديث خاص أنّ "الإصدار الثاني من نموذج فالكون الإماراتي، يختلف عن الإصدار الأوّل، والإصدارات الأجنبية، في التحديث المتعلق بالداتا، وطريقة التطوير. فالإصدار الجديد هو أسرع، وأداؤه أقوى، ويتفوّق على نموذج لاما 3 7B الجديد من ميتا، الذي تمّ تدريبه على داتا يبلغ حجمها 15 تيرا بايت، لإصدار النموذج، أمّا نحن، فاستعملنا فقط 5 تيرا بايت، أي ثلث الحجم الذي استخدموه، وتمكّنا من الحصول على نموذج لغوي عالي الجودة، فيما أداؤه متقارب وأداء Gemma 7B، من غوغل. بالإضافة إلى أنّ نموذجنا هو مفتوح المصدر، على عكس نموذج غوغل على سبيل المثال الذي لا يمدّ معلوماته للعامة، ولا يعطي أيّ معلومات عن حجم الداتا التي تمّ تمرين النموذج عليها".
 
 
يذكر أنّ برنامج falcon الإماراتي يتميّز عن برنامج chat GPT وGemini، بأنّه مصمّم من قبل الدولة الإماراتيّة، على عكس النماذج الأخرى التي تحتكرها شركات خاصّة، كـ"غوغل" و"أوبن إيه آي" و"مايكروسوفت". وهو ما دفع بعدد من الدول إلى أن تحذو حذو الإمارات، نظراً لأهميّة الذكاء الاصطناعي التوليدي، وضرورة ألا يكون استخدامه لأهداف تجارية فقط.
 
"ويمكّن فالكون كل الشركات، بمختلف أنواعها وأحجامها، الكبيرة والناشئة والمؤسسات الخاصّة والعامّة، وحتى الأفراد، من تطوير النموذج بما يتلاءم واحتياجاتهم، عبر الفاين تيونينغ، للوصول إلى أعلى مستوى من الأداء أو الفعالية، ما يفعّل الإنتاجيّة، ويساعد في تقليص الوقت المطلوب لإنهاء المهام المطلوبة"، بحسب بوساحة.
 
ويعزّز هذا النموذج موقع الإمارات كدولة رائدة في مجال الذكاء الاصطناعي بالنسبة للشركات العالمية، وخاصة الأميركية، ويثبت أنها حققت قفزة نوعية في التطوّر التكنولوجي، ما يضعها في المراتب الأولى في التصنيفات العالمية.

الابتكار والاستراتيجية التسويقية
وكشفت عالمة البيانات، أنّ "عدد الباحثين من معهد الابتكار الذين عملوا على النموذج بلغ 30 باحثاً، 60 في المئة منهم عرب و40 في المئة أجانب"، ما يؤكّد كفاءة العقول العربيّة، القادرة على تطوير نماذج إلكترونية عالية الجودة والمنافسة مع النماذج الأجنبية.
وعلى الرغم من السرية التي تحيط بالكلفة المالية للمشروع، صرّحت بوساحة، عن الكلفة من ناحية الـComputation cost، (وهو يعبّر عن عدد الوظائف أو العمليات الحسابية مضروبة بالوقت المطلوب لمعالجة كل منها)، مشيرة إلى "أننا استخدمنا حوالى 1000GPU’s (وحدة معالجة الرسوم) لمدّة شهرين".
وعن الاستراتيجيات التسويقية التي تُعتمد لتسويق النموذج أجابت بأنّ "ميزة المصدر المفتوح، كانت أقوى استراتيجية لتسويق النموذج، وعامل جذب قويّ. وقد سجّل نموذج Falcon2 11 B، 36418 تحميل، بعد أقلّ من شهر على إطلاقه. أمّا الـFalcon 2 11B VLM ، فسجّل 1,282 تنزيلاً".

ويتكوّن Falcon 2 من نموذجين أساسيين:

Falcon 2 11B: يتعامل هذا النص مع مهام مثل كتابة القصائد أو رسائل البريد الإلكتروني، والرموز والنصوص والمقطوعات الموسيقية أو حتى التعليمات البرمجية ويمكنه ترجمة اللغات بدقة عالية، واقتراح عبارات مختلفة، والتحقق من الأخطاء النحوية، ما يجعل الكتابة أمراً سهلاً، ويعزز التواصل وتبادل المعلومات.

Falcon 2 11B VLM (نموذج الرؤية واللغة): هذا العبقري يسدّ الفجوة بين الصور والكلمات. بمجرد تحميل أي صورة، سيقوم نموذج الرؤية واللغة بوصف ما يراه، وهو مثالي لإنشاء محتوى أو تسهيل الوصول إلى الويب. كما يقوم هذا النموذج بتحليل الصور التي تم تحميلها وإنشاء أوصاف نصية مفصلة، ما يجعلها ذات قيمة لمهام مثل أدوات الوصول إلى الصور وإنشاء المحتوى. ويمكن تدريبه على تصنيف الصور إلى فئات مختلفة، ما يساعد في تنظيم الصور واسترجاعها.
وشدّدت بوساحة على أنّ "معهد أبو ظبي للابتكار التكنولوجي، لا يستهدف تحقيق الأرباح التجارية من نموذج فالكون، بل هدفه الرئيسي هو تقوية وتطوير الإنتاج، وتكريسه للمصادر المفتوحة. إلّا أن مما لا شكّ فيه أنّ النموذج بعد تخصيصه من قبل الشركات، كلّ ضمن مجالها، بإمكانه أن يعود عليها بأرباح ماليّة ضخمة".
وعن الخطوات اللاحقة التي يستهدفها المعهد قالت: "نحن مستمرون في تطوير تكنولوجيا الذكاء الاصطناعي التوليدي، التي تسمح بتحسين قدرة الإصدارات المقبلة من نموذج فالكون، وتقوية قدرة الاستيعاب والرفع من ذكائه. كما نعمل على تطوير نموذج الرؤية واللغة، ليشمل الفيديوات التي تحتوي معلومات أكثر من الصور، وأبعاد أخرى كالصوت والوقت والتسلسلات، وبالتالي يصبح بإمكان المستخدم أن يسأل أسئلته على الفيديوات أيضاً لا فقط الصور أو النصوص. وهذه الميزة غير موجودة حالياً في النماذج الأجنبية. وعندها سيصبح نموذج فالكون يتسع للفيديوات والصور والتسجيلات الصوتية أيضاً".
أمّا نظام الأمان في فالكون الإماراتي، فهو أكثر تطوّراً، ويلتزم بمعايير سلامة وأخلاقية أكثر دقّة من نماذج الشركات الخاصّة، لأن الدولة نفسها تستخدمه في مرافقها العامّة، ما يحتّم عليها تطوير نظام الأمان الخاص به، لمنع التعرض لأي خرق، ومنع أيّ شخص من استخدام هذا النموذج لأيّ غرض سيّئ.
ولعلّ أبرز ما يميّز نموذج فالكون عن باقي نماذج الذكاء الاصطناعي، هو التطوير الذي طال المحتوى المتوفّر باللغة العربية، حيث شرحت بوساحة أنّ "شركات في الإمارات أصدرت LLM للغة العربية، ونحن نعمل على تخصيص LLM 100 في المئة باللغة العربية، لتعزيز مكانة دولة الإمارات العربية في مجال الـLLM بالعربية. وهو ما سيسمح للإمارات بتزويد العالم بمحتوى دسم عن الحضارة العربية، صادر عن لسان الراوي، لا عن مصادر غربية، وهو ما يحمي الإرث والحضارات العربية من عمليّة التزوير. ويدفع هذا التطوير باللغة العربية لأن تكون جزءاً رئيسياً من التطوّر التكنولوجي العالمي.
ويذكر أن فالكون متعدد اللغات، ويشكل 11 لغة أخرى غير اللغة الإنكليزية، ما يسمح بتقوية تقنيات الترجمة من لغة إلى أخرى، ويجعلها متطوّرة أكثر بكثير من باقي النماذج".
الكلمات الدالة

اقرأ في النهار Premium