لعدة سنوات، وعد مجال الذكاء الاصطناعي بإحداث ثورة في حياتنا بفضل نماذج التعلّم الآليّ، التي تتغذّى على كميّات هائلة من البيانات. لكن ما الذي سيحدث عندما تجفّ آبار المعلومات هذه؟
ساعدت هذه البيانات الهائلة في تطوير تقنية التعلّم العميق، التي أحدثت نقلة نوعيّة في عالم الكمبيوتر. ومع النقلة النوعيّة المتمثلة بالذكاء التوليديّ، تسيطر النماذج اللغوية الكبرى (LLMs) على المشهد المعلوماتي. ومن المستطاع وصف تلك النماذج بأنّها برامج متخصّصة في معالجة النصوص توصلاً إلى استيلاد نصّ جديد منها. تتدرب هذه النماذج على تريليونات الكلمات المستخرجة من الإنترنت والكتب والصحف، وتتعلم كيفية "تفهم" اللغة واستخدامها من خلال عملية تسمى "التدريب المعزز بإشراف ذاتي" Self Supervised Reinforcement Learning.
مع ذلك، فإن شهية النماذج اللغوية الكبيرة للبيانات لا تشبع. إذ تستهلك المعلومات بسرعة مذهلة، لدرجة أن الباحثين يخشون نفاد مخزون البيانات النصيّة عالية الجودة بحلول عام 2028. ويطلق الخبراء على هذه الظاهرة التي تلوح في الأفق "جدار البيانات".
لا يستسلم الباحثون في مجال الذكاء الاصطناعي لهذا التحدّي بسهولة، بل يطوّرون استراتيجيّات جديدة للتعامل مع جدار البيانات. في هذا المجال، يبرز التركيز على الجودة لا على الكمّ. وبدلاً من مجرّد إغراق النماذج بكميات هائلة من النصوص، فإنهم يركّزون على جودتها. مثلاً، تعتبر النصوص الأكاديمية والتقارير العلميّة أكثر قيمة من التغريدات على مواقع التواصل الاجتماعي، لأنّها توفّر معلومات دقيقة وموثوقة.
يجري كذلك استكشاف مصادر بيانات جديدة. ومع اقتراب نفاد البيانات النصيّة، تتجه الأنظمة الحديثة إلى التعلّم من مصادر أخرى مثل الصور والفيديوات والملفات الصوتيّة.
ظهرت أيضاً مساعٍ لإنشاء البيانات المصنَّعة، إذ بدلاً من الاعتماد كليًا على البيانات الحقيقية، يمكن للذكاء الاصطناعي أن يولّد بياناته الخاصّة. على سبيل المثال، يمكن لنموذج لغويّ كبير أن يطوّر حلًا لمشكلة رياضية خطوة بخطوة، ثم يقوم "مساعد" ذكاء اصطناعيّ آخر بتقييم الحلّ واختيار الأفضل.
بين التعاون والاحتكار؟
يُثير جدار البيانات مخاوف بشأن مستقبل الذكاء الاصطناعي. فهل ستدخل شركات التكنولوجيا العملاقة في سباق تسلّح على البيانات، أم يمكن تحقيق تقدم من خلال التعاون الدولي؟ يُحذّر بعض الخبراء من سيطرة شركات التكنولوجيا الكبرى على أفضل مصادر البيانات، ممّا يُعيق تقدّم المنافسين، ويخلق فجوة يصعب تجاوزها.
لكن خبراء آخرين يدعون إلى نهج أكثر تعاونًا، ويقترحون إنشاء قواعد بيانات مشتركة للذكاء الاصطناعيّ يُمكن للجميع الوصول إليها.
إذن، يواجه الذكاء الاصطناعي تحدّيًا يتمثّل بإمكانية نفاد البيانات، فيما يطوّر الباحثون استراتيجيات مبتكرة للتعامل معه. يعتمد مستقبل الذكاء الاصطناعي على قدرة البشر على التعاون والمشاركة في البيانات والخبرات. فإذا نجحنا في تجاوز عقبة جدار البيانات، يمكن للذكاء الاصطناعي التوليدي أن يحقق إنجازات مذهلة في مختلف المجالات. ولكن إذا ساد التنافس على البيانات، فسيكون هذا المسار عرضة للتباطؤ.