أطلقت شركة جوجل العملاقة للتكنولوجيا أخيرًا عن Gemini AI، وهي سلسلة من نماذج الذكاء الاصطناعي التوليدية التي تدعي أنها “الأكبر والأكثر قدرة” حتى الآن.
قال ساندر بيتشاي، الرئيس التنفيذي لشركة جوجل: “يمثل هذا العصر الجديد من النماذج أحد أكبر الجهود العلمية والهندسية التي قمنا بها كشركة”.
الذكاء الاصطناعي متعدد الوسائط: الذكاء الاصطناعي التوليدي عبارة عن خوارزميات تم تدريبها لإنشاء محتوى أصلي استجابة لمطالبات المستخدم. على سبيل المثال، يمكن للإصدار الأول من OpenAI لـ ChatGPT فهم وإنتاج نص يشبه الإنسان، في حين يمكن لنظام DALL-E 2 الخاص به إنشاء صور بناءً على المطالبات النصية.
هذه الأنظمة تفهم وتولد نوعًا واحدًا فقط من المحتوى، يمكن للذكاء الاصطناعي المولد متعدد الوسائط العمل مع عدة أنواع – في سبتمبر، أعلنت OpenAI عن إصدار متعدد الوسائط من ChatGPT يمكنه فهم مدخلات الصور والصوت والنص.
“إن قدراتها هي أحدث ما توصلت إليه التكنولوجيا في كل المجالات تقريبًا.”
وفقًا لشركة جوجل، يتم إنشاء الذكاء الاصطناعي متعدد الوسائط بشكل تقليدي من خلال الجمع بين نماذج منفصلة ومتخصصة في برنامج واحد، لكنها اتبعت نهجًا مختلفًا مع Gemini AI، حيث قامت بتدريبه ليكون متعدد الوسائط منذ البداية.
قال ديميس هاسابيس، الرئيس التنفيذي والمؤسس المشارك لشركة Gemini: “يساعد هذا شركة Gemini على فهم جميع أنواع المدخلات من الألف إلى الياء والتفكير فيها بسلاسة، وهو أفضل بكثير من نماذج الوسائط المتعددة الحالية – وقدراتها هي أحدث ما توصلت إليه التكنولوجيا في كل مجال تقريبًا”. جوجل ديب مايند.
بالإضافة إلى كونه يتمتع بقدرات عالية، تقول Google إن Gemini AI هو أيضًا نموذجها “الأكثر مرونة”. وقد سمح ذلك للشركة بإنشاء ثلاثة أحجام مختلفة من الذكاء الاصطناعي: Ultra وNano وPro.
وفقًا لشركة جوجل، فهو أول نموذج ذكاء اصطناعي توليدي يتفوق في الأداء على الخبراء البشريين في اختبار MMLU، وهو معيار لتقييم المعرفة عبر 57 موضوعًا. تطلب Google حاليًا تعليقات حول Ultra من مستخدمين محددين، ولكنها تتوقع إتاحته على نطاق واسع في عام 2024.
يعد Gemini Nano هو النموذج الأقل قدرة، ولكنه صغير وفعال بما يكفي لتشغيله محليًا على الهواتف الذكية. لقد أتاحته Google بالفعل على هاتف Pixel 8 Pro – حيث يمكن لأصحاب هذا الهاتف الذكي استخدام الذكاء الاصطناعي لتلخيص التسجيلات الصوتية أو إنشاء ردود على رسائل WhatsApp.
وفي الوقت نفسه، يقع Gemini Pro بين Nano وUltra من حيث الإمكانيات والحجم. قامت جوجل بدمج نسخة باللغة الإنجليزية من هذا النموذج في برنامج Bard الذي يشبه ChatGPT، والذي يقال إنه سيحصل على ترقية Ultra في عام 2024.
Google’s new Gemini AI model is out.
The big deal is that it appears to be the first model to beat GPT-4. The fascinating thing is that it does it by just a tiny bit.
It is supposedly integrated into Bard now but I haven’t seen an immediate difference. More when I can test it pic.twitter.com/0AIRosfdXG
— Ethan Mollick (@emollick) December 6, 2023
كانت جوجل تتسابق للحاق بـ OpenAI في مجال الذكاء الاصطناعي التوليدي منذ إصدار ChatGPT في عام 2022، وكانت تروج لـ Gemini AI منذ أشهر باعتبارها التكنولوجيا التي ستضع قدما.
على الرغم من تفوق Gemini في أداء GPT-4 الخاص بـ OpenAI في 30 من 32 معيارًا تم اختباره (بما في ذلك MMLU)، كان الفارق غالبًا مجرد نقطة مئوية أو اثنتين – مما يعني أن Google قد تكون في المقدمة، ولكن بنسبة قليلة فقط ومقارنة بنموذج الذكاء الاصطناعي الذي لقد كان خارج لمدة 9 أشهر بالفعل.
واشارت ميلاني ميتشل، باحثة الذكاء الاصطناعي في معهد سانتا في في نيو مكسيكو، لمعهد ماساتشوستس للتكنولوجيا: “من الواضح أن جيميني هو نظام ذكاء اصطناعي متطور للغاية لكن ليس من الواضح بالنسبة لي أن جيميني في الواقع أكثر قدرة بشكل كبير من جي بي تي-4”.