أن يكون للبشر نموذجٌ سلوكيٌّ واضح هو أمرٌ ضروريّ في عمليّة بناء أنظمة الذكاء الاصطناعيّ التي تكون مهمّتها مساعدة الإنسان في خياراته. لكن ثمّة مشكلة أساسيّة: عند اتّخاذ القرارات، يميل البشر إلى التصرف دون المستوى الأمثل.
غالباً ما تتلخّص هذه اللاعقلانيّة التي يصعب نمذجتها، في القيود الحسابيّة، بحسب تقرير في موقع "سايتكدايلي". بعبارة أخرى، لا يمكن للإنسان أن يقضي عقوداً وهو يفكّر في الحل الأمثل لمشكلة واحدة.
يشير التقرير إلى أنّ باحثين في "معهد ماساتشوستس للتكنولوجيا" وجامعة واشنطن طوّروا طريقة لنمذجة سلوك وكيل، سواء كان إنساناً أو آلة، وهي تفسّر القيود الحسابيّة غير المعروفة التي قد تعيق قدرات الوكيل على حل المشاكل. يمكن لنموذجهم أن يستنتج تلقائيّاً القيود الحسابيّة للوكيل من خلال رؤية عدد قليل من آثار أفعاله السابقة. النتيجة، وهي ما يسمّى بـ "موازنة الاستدلال" لدى الوكيل، يمكن استخدامها للتنبّؤ بسلوكه في المستقبل.
تطبيقات عمليّة وتحقّق من صحّة النّموذج
يمكن أن يساعد هذا العمل العلماء على تعليم أنظمة الذكاء الاصطناعيّ كيفيّة تصرّف البشر، مما قد يمكّنها من الاستجابة بشكل أفضل للبشر المتعاونين معها. يقول أثول بول جيكوب، طالب دراسات عليا في الهندسة الكهربائيّة وعلوم الكمبيوتر، والمؤلّف الرئيسيّ لورقة بحثيّة، إن القدرة على فهم سلوك الإنسان، ومن ثم استنتاج أهدافه من هذا السلوك، يمكن أن تجعل مساعد الذكاء الاصطناعيّ أكثر فائدة بكثير.
MIT’s New AI Model Predicts Human Behavior With Uncanny Accuracy | https://t.co/7n870DmU9w
— SciTechDaily (@SciTechDaily1) April 19, 2024
ويضيف: "إذا علِمنا أنّ إنساناً على وشك ارتكاب خطأ، بعد أن رأينا كيف تصرّف من قبل، فسيكون بإمكان وكيل قائم على الذكاء الاصطناعيّ أن يتدخّل ويقدّم طريقة أفضل للقيام بذلك. أو يمكن للوكيل أن يتكيّف مع نقاط الضعف التي يعاني منها البشر المتعاونون معه. إنّ القدرة على نمذجة السلوك البشريّ تعدّ خطوة مهمّة نحو بناء وكيل مستند إلى الذكاء الاصطناعيّ يمكنه بالفعل مساعدة ذلك الإنسان".
كتب جَيكوب الورقة مع أبيشيك غوبتا، أستاذ مساعد في جامعة واشنطن، والمؤلّف الكبير جيكوب أندرياس، الأستاذ المشارك في الهندسة الكهربائيّة وعلوم الكمبيوتر وعضو في مختبر علوم الكمبيوتر والذكاء الاصطناعيّ. وسيقدّم البحث في المؤتمر الدوليّ لتمثيلات التعلّم في أيّار (مايو) المقبل.
نمذجة السلوك
بحسب التقرير، قام باحثون ببناء نماذج حسابيّة للسلوك البشريّ طوال عقود من الزمن. حاولت كثير من الأساليب السابقة مراعاة عمليّة اتّخاذ القرار دون المستوى الأمثل عن طريق إضافة ضوضاء إلى النموذج. بدلاً من قيام الوكيل دائماً باتّخاذ الخيار الصحيح، قد يطلب النموذج من هذا الوكيل اتّخاذ الخيار الصحيح بنسبة 95 في المئة من الوقت. مع ذلك، قد تفشل هذه الأساليب في فهم واقع أنّ البشر لا يتصرّفون دائماً دون المستوى الأمثل بنفس الطريقة.
لبناء نموذجهم، استلهم جَيكوب ومعاونوه ابتكارهم من دراسات سابقة للاعبي شطرنج. ولاحظوا أنّ اللاعبين يستغرقون وقتاً أقلّ في التفكير قبل التصرّف عند القيام بحركات بسيطة، وأنّ اللاعبين الأقوياء يميلون إلى قضاء وقت أطول في التخطيط بالمقارنة مع اللاعبين الأضعف في المباريات الصعبة. وقاموا ببناء إطار يمكن أن يستنتج عمق تخطيط الوكيل من الإجراءات السابقة واستخدام تلك المعلومات لنمذجة عمليّة اتّخاذ القرار لدى الوكيل.
Things are getting scarier
— Dino Philopoulos (@cozaman) April 20, 2024
MIT’s New AI Model Predicts Human Behavior With Uncanny Accuracy https://t.co/TiCVZK9C39
تتضمّن الخطوة الأولى في أسلوبهم تشغيل خوارزميّة لفترة زمنيّة محدّدة لحلّ المشكلة قيد الدراسة. على سبيل المثال، إذا كانوا يدرسون مباراة شطرنج فقد يسمحون لخوارزميّة تلعب الشطرنج بالعمل لعدد معيّن من الخطوات. في النهاية، يمكن للباحثين رؤية القرارات التي اتّخذتها الخوارزميّة في كلّ خطوة.
يقارن نموذجهم تلك القرارات بسلوكيّات وكيل يحلّ المشكلة نفسها. سيقوم بمواءمة قرارات الوكيل مع قرارات الخوارزميّة وتحديد الخطوة التي توقّف فيها الوكيل عن التخطيط.
من هنا، يمكن للنّموذج تحديد موازنة الاستدلال لدى الوكيل، أو المدّة التي سيخطّط فيها ذلك الوكيل لحلّ هذه المشكلة. ويمكنه استخدام موازنة الاستدلال للتنبّؤ بكيفيّة ردّ فعل هذا الوكيل عند حلّ مشكلة مماثلة.
حلّ قابل للتفسير
بإمكان هذه الطريقة فعّالة للغاية لأنّه يمكن للباحثين الوصول إلى المجموعة الكاملة من القرارات التي اتّخذتها خوارزميّة حلّ المشاكل من دون القيام بأيّ عمل إضافيّ. يمكن أيضاً تطبيق هذا الإطار على أيّ مشكلة يمكن حلّها باستخدام فئة معيّنة من الخوارزميات.
اختبر الباحثون نهجهم في ثلاث نمذجات مختلفة: استدلال أهداف التقدّم من الطرق السابقة، وتخمين النيّة التواصليّة لشخص ما من خلال إشاراته اللفظيّة، والتنبّؤ بالتحرّكات اللاحقة في مباريات الشطرنج بين البشر.
لقد تطابقت طريقتهم مع بديل شائع في كلّ تجربة أو تفوّقت عليه. علاوة على ذلك، رأى الباحثون أنّ نموذجهم للسلوك البشريّ تطابق بشكل جيّد مع مقاييس مهارة اللاعب (في مباريات الشطرنج) وصعوبة المهمّة.
وللمضيّ قدماً، يريد الباحثون استخدام هذا النهج لنمذجة عمليّة التخطيط في مجالات أخرى، مثل التعلّم المعزّز (طريقة التجربة والخطأ المستخدمة بشكل شائع في الروبوتات). وعلى المدى الطويل، يعتزمون مواصلة الاستناد الى هذا العمل لتحقيق الهدف الأكبر المتمثّل في تطوير متعاونين أكثر فاعليّة في مجال الذكاء الاصطناعيّ.