كشفت جامعة محمد بن زايد للذكاء الاصطناعي، بالتعاون مع شركة "بيتووم" ومنصة "LLM360"، عن إطلاق نموذج "K2-65B" الجديد، وهو نموذج لغوي كبير رائد مفتوح المصدر يستند إلى 65 مليار مُعامِل. ويتميز بأنّه يرفع من مستوى معايير الشفافية والأداء في مجال الذكاء الاصطناعي مفتوح المصدر. إذ يوفّر نهجاً محتملاً لتوثيق ودراسة دورة الحياة الكاملة للنماذج اللغوية الكبيرة، بما في ذلك جميع تفاصيل عملية الاستنساخ.
وفي التفاصيل، فإن نموذج "K2-65B" متاح مجاناً على مستوى العالم بموجب رخصة "أباتشي 2.0"، وهو النموذج اللغوي الكبير الوحيد القابل للاستنساخ من طرف ثالث، والذي يتفوّق في الأداء على أهمّ النماذج اللغوية الكبيرة المتقدّمة المتوفرة في القطاع الخاص، مثل نموذج "لاما 270B".
ولا بدّ من الإشارة إلى أنّه تمّ تدريب النموذج باستخدام 1.4 تريليون وحدة لغوية و480 وحدة معالجة رسومات من نوع "A100" ضمن سحابة "دي جي أكس" الخاص بشركة "إنفيديا"، أي باستخدام موارد أقل بنسبة 35 في المئة من الموارد المستخدَمة لتدريب نموذج "لاما 270B"، ما يجعله واحداً من النماذج الأكثر استدامة في العالم ضمن فئته. هذا ويستطيع نموذج K2 أن ينافس نماذج أكبر بكثير، مثل "جي بي تي-4"، في بعض المجالات الإستراتيجية، مثل التفكير المتعلق بالرياضيات والمنطق.
في هذا الإطار، أحرزت الشركات الإماراتية تقدّماً هائلاً في هذا المجال في السنوات الأخيرة، لا سيّما من خلال إطلاق "جيس"، وهو النموذج اللغوي الكبير الأكثر تقدّماً في العالم باللغة العربية، والذي يُعتبر ثمار التعاون الوثيق بين شركة "كور 42" وجامعة محمد بن زايد للذكاء الاصطناعي وشركة "سيريبراس سيستمز".
وفي هذا الصدد، صرّح رئيس جامعة محمد بن زايد للذكاء الاصطناعي البروفسور إريك زينغ أن "إطلاق نموذج K2-65B يُثبت كفاءة دولة الإمارات في تطوير النماذج اللغوية الكبيرة العالية المستوى، وهي كفاءة تزداد يوماً بعد يوم. ويجسّد هذا النموذج أهمية تبني نهجاً مفتوحاً يقوم على التعاون بين مختلف الأطراف بهدف إنشاء نماذج لغوية كبيرة تتميز بمستوى استثنائيّ من الأداء والكفاءة والقدرة على إحداث تغيير جذريّ في جميع القطاعات والمنظمات".
النموذج الجديد يتفوّق على "لاما 270B"
قد تم تدريب النموذج "K2-65B" على مرحلتين، وخضع إلى 22 عملية تقييم صارمة وشاملة لتحديد مستوى أدائه في مختلف التخصصات، مثل الرياضيات والبرمجة والطب ومجالات أخرى، وتفوّق النموذج الجديد على نموذج "لاما 270B" في كلّ مجال من هذه المجالات.
كما أظهر "K2-65B" مستويات أداء عالية حتى في المجالات التي يُعتبر التنافس فيها صعباً مع أفضل النماذج اللغوية الكبيرة المفتوحة. وقد تفوّق نموذج الدردشة الخاص به على نموذج الدردشة الخاص بـ"لاما 270B" على جميع المستويات التي شملها التقييم، إذ أثبت قدرته على الفهم وتوليد إجابات شبيهة بإجابات الإنسان في مختلف السيناريوهات.
وفي هذا السياق، تعليقاً على إطلاق النموذج، قال هيكتور ليو، رئيس قسم الهندسة في شركة "بيتووم" والمطوّر الرئيسي للنموذج: "يشكّل توفير مخطط لاستنساخ نموذج K2 عاملاً أساسياً لتعزيز المعرفة والقدرة البحثية وخيارات تطوير النماذج اللغوية الكبيرة على المستوى العالمي. وأنا على يقين بأنّ إصدار نموذج بهذا الحجم وبهذه الجودة سيؤثّر إيجاباً في منظومة المصادر المفتوحة، إذ سيتفاعل المجتمع مع النموذج ويستفيد من الحلول التي توصلنا إليها، على غرار ما شهدناه مع النماذج السابقة على منصة LLM360، مثل "أمبر" و"كريستال كودر".
إضافة إلى ما ذُكر، يستخدم النموذج "K2-65B" قدرات حاسوبية أقلّ من تلك التي تستخدمها النماذج اللغوية الكبيرة المشابهة، فيدعم زيادة الكفاءة التشغيلية ويساهم في الحدّ من استهلاك الطاقة، ما يمكّن المستخدمين في جميع أنحاء العالم من الالتزام بممارسات الحوسبة المستدامة.
هذا وتقدّم "المجموعة البحثية" على منصة "LLM360" للباحثين والمطوّرين مجموعة كبيرة من الأدوات التي يحتاجونها لدراسة ديناميكيات التدريب، ما يوفّر لهم موارد مهمة جداً تساعدهم على التعمّق في أبحاثهم واستكشافاتهم.
الجدير بالذكر أنّ فريق العمل الذي طوّر هذا النموذج يدرس إمكانية إعداد النموذج لفهم الصور، إلى جانب المبادرات التي أطلقها لتطويره وتقييمه والتي تهدف إلى تحسين أداء النموذج باستمرار وتعزيز استخداماته المتعدّدة.