سعت شركة "أوبن أي آي" Open AI وفي ظلّ سباق عالمي للذكاء الاصطناعي التوليدي إلى إطلاق منتجات وترقيات جديدة منذ إصدار "شات جي بي تي" في تشرين الثاني (نوفمبر) 2022، الذي سجل استعمال 100 مليون مستخدم للتطبيق في غضون شهرين ما اعتُبر رقماً قياسياً في التطبيقات الأسرع نمواً.
وعبر الإنترنت، أعلنت الشركة عن الإصدار الرابع من نموذجها الشهير للذكاء الاصطناعي التوليدي الذي بميزات وصفتها بأنها "ثورية"، بمعنى أنها متميزة نوعياً بشكل جذري عن الإصدارات السابقة. وبيّنت الشركة أنها ستوفره إلى المستخدمين خلال الأسابيع القليلة المقبلة. واستكمالاً، بينت الشركة أن الفارق الرئيسي في إصدارها الجديد يتمثل في استخدام مزيج من الصوت والفيديو والصورة والكتابة، أي أسلوب الميلتي ميديا، في التواصل. وسيتوفر الإصدار GPT-4o بميزاته الجديدة لجميع المستخدمين، سواء حصولوا عليه مجانًا أو بالأجر.
وتذكيراً، يتمثل الفارق الأساسي بين الإصدار الجديد وما سبقه في استخدام الميلتي ميديا في مخاطبة "شات جي بي تي أو" وفي ما يصدر عنه من إجابات.
وتناول "سام ألتمان" الرئيس التنفيذي لشركة "أوبن إيه آي"، الميزات الجديدة في GPT-4o، واعتبر أنها تُظهر "الذكاء الاصطناعي وكأنه من الأفلام. ولا يزال من المفاجئ بعض الشيء بالنسبة لي أنه حقيقي".
وعملت الشركة على إبراز الميزات الجديدة في سياق إعلانها عن منتجها الحديث. إذ تحدث ثلاثة أشخاص في الوقت نفسه إلى التطبيق الجديد، واستخدموا كلهم أسلوب الميتلي ميديا في الحوار معه؛ ونجح في التفاعل الفائق السرعة معهم كلهم في الوقت نفسه، مع إعطاء إجاباته بطريقة الميلتي ميديا على الرغم من أن الإجابات كانت متميزة لكل منهم على حدة، أي أنه استمر في التعرف إليهم خلال التفاعل بالوسائط المتعددة معه.
ولقد قارن بعض المستخدمين على منصة "إكس" النكهة الجديدة للتطبيق بفيلم "هير" "Her"، حيث تمثل الذكاء الاصطناعي التوليدي بهوية أنثى يتمتع التواصل معها بصفات لا يمكن تمييزها عن الشخصية البشرية. ويعيدنا ذلك إلى ما أوردته الشركة أثناء الإعلان عن GPT-4o، حينما أشارت الشركة إلى أنه يظهر وكأنه " لم تسمعوه" من قبل. ويرمز الحرف "أو" "o" في تسمية التطبيق الجديد إلى كلمة "أومني" omni التي تعني "الكلي" باللاتينية والإنجليزية. وكذلك شددت على أنه يمتلك "ذكاءً عاطفياً" أكثر من التطبيقات السابقة، وأنه "يتحدث ويمازح ويرى كل شيء"!
بالإضافة إلى ذلك، أصبح بإمكان مستخدمي البرنامج الآن الوصول إلى ميزة "التصفح" التي تمكن "شات جي بي تي" من عرض معلومات محدثة تتعلق بإجابته من الويب، حسبما أفادت موراتي لـ"رويترز". وأكدت موراتي أن الشركة لا تنوي جني الأموال من المستخدمين المجانيين من خلال بيع الإعلانات.
وفي محادثة أجراها بدا نموذج الذكاء الاصطناعي الذي يدعم الآن أكثر من 50 لغة، عفوياً ومضحكاً. وحينما طُلب إليه أن يروي قصّة بمستويات مختلفة من "الدراما" بصوته، فعل ذلك بشكل مقنع، ثمّ روى القصة بصوت الروبوت النمطيّ، ثمّ مرة أخرى بطريقة الغناء. وأوضحت الشركة كيف يمكن مقاطعة صوت الذكاء الاصطناعي، والتوقف عن الحديث سريعاً.
وفي السياق عينه، يتمتع "شات جي بي تي" الجديد أيضًا بالقدرة على "رؤية" الأشياء والتفكير فيها. من خلال كاميرا الهاتف، عُرضت عليه مسألة حسابية مكتوبة على لوحة بيضاء وطلب إليه المساعدة في حلّها. ثم طُلب إليه شرح بعض رموز الكمبيوتر. وقام التطبيق أيضًا بترجمة مباشرة من الإيطالية إلى الإنكليزية وبالعكس.
يعزز هذا النموذج إمكانية وصول المستخدم إلى إمكانات الذكاء الاصطناعي القوية، بما في ذلك التعامل مع التفاعلات المعقدة عبر النص والصورة والصوت. تشمل الميزات الرئيسية الفهم المتقدم وتوليد اللغة الطبيعية، وتحسين سرعة المعالجة، وإمكانات التعامل مع البيانات في الوقت الفعلي عبر الوسائط المختلفة.
تطبيق سطح المكتب وواجهة المستخدم المحدثة
يوفر تطبيق سطح المكتب الجديد لـ GPT-4o للمستخدمين واجهة مبسطة تعمل على تبسيط التفاعل. تعمل واجهة المستخدم المحدثة على تقليل عوامل التشتيت، مع التركيز على سهولة الاستخدام والتكامل في المهام اليومية، مما يجعل الذكاء الاصطناعي شريكًا أكثر سهولة في العمل والإبداع.
تحسين الجودة والسرعة في 50 لغة
قامت OpenAI بترقية GPT-4o بشكل كبير لتقديم أداء أكثر كفاءة عبر 50 لغة، مما يضمن ترجمات عالية الجودة وإنشاء المحتوى ومعالجة البيانات. وهذا يجعل من GPT-4o أداة متعددة الاستخدامات للمستخدمين العالميين، مما يقلّل من حواجز اللغة في تفاعل الذكاء الاصطناعي.