تستخدم شركة تويوتا طريقة تعتمد على الذكاء الاصطناعي لتعليم الروبوتات المهارات المختلفة ، كيفية تقشير الخضار، وإعداد الوجبات الخفيفة، وأداء مهام بارعة أخرى قد تجعلها مفيدة في العالم الحقيقي.
قال روس تيدريك، نائب رئيس أبحاث الروبوتات في معهد أبحاث تويوتا (TRI): “تسمح لك هذه الطريقة بتعليم المهارات للروبوتات بشكل أسرع وبعروض توضيحية أقل بكثير من أي وقت مضى”.
كأس الروبوتات هو إنشاء روبوتات للأغراض العامة يمكنها دخول أماكن عملنا أو منازلنا وتتعلم بسرعة أداء مهام جديدة. ومع ذلك، للوصول إليه، سنحتاج إلى طريقة سريعة وفعالة لتدريب الذكاء الاصطناعي الذي يقوم بتشغيل الروبوتات.
“حتى قبل عام واحد، لم أكن أتوقع أننا اقتربنا من هذا المستوى من البراعة المتنوعة.”
في حين أن العديد من التقنيات واعدة – مثل عرض مقاطع فيديو توضيحية للذكاء الاصطناعي ومنحها “مكافآت” كما لو كنت تدرب كلبًا – إلا أن البحث عن أسرع طريقة لتدريب الروبوتات وأكثرها كفاءة لا يزال مستمرًا.
ما هو الجديد؟ أعلنت شركة TRI عما تعتقد أنها طريقة “اختراق” لتعليم الروبوتات مهارات حاذقة جديدة، من النوع الذي يتطلب لمسة دقيقة، مثل سكب السوائل أو التعامل مع الأشياء الناعمة.
وتقول TRI إنها استخدمت بالفعل هذه الطريقة لتعليم الروبوتات بسرعة أكثر من 60 مهارة، بما في ذلك كيفية استخدام الخلاطات اليدوية، وقلب الفطائر، ووضع الأطباق في رف التجفيف. هدفها الوصول إلى 200 مهارة بنهاية عام 2023 و1000 بحلول نهاية عام 2024.
قال تيدريك: “إن المهام التي أشاهد هذه الروبوتات تؤديها هي ببساطة مذهلة. حتى قبل عام واحد، لم أكن أتوقع أننا اقتربنا من هذا المستوى من البراعة المتنوعة”.
يتم إنشاؤها من خلال قيام باحث بالتحكم يدويًا في الروبوت باستخدام واجهة التشغيل عن بعد المطورة خصيصًا. توفر هذه الواجهة ردود فعل لمسية للمشغل، مما يعني أنه يشعر بها عندما يقوم الروبوت بالاتصال بشيء ما.
عادةً ما يقوم المشغل بتوجيه الروبوت خلال مهمة جديدة بشكل متكرر لمدة ساعة أو ساعتين، ويعرضها في أي مكان من بضع عشرات إلى مئات المرات، بينما تسجل كاميرات الروبوت وأجهزة الاستشعار اللمسية العملية.
التدريب السريع: سياسة الانتشار معقدة (يمكنك قراءة ورقة الباحثين على arXiv للحصول على جميع التفاصيل)، ولكن خلاصة القول، وفقًا لـ TRI، هي أنها أسرع بكثير من طرق التدريب الأخرى.
وقال بن بورشفييل، مدير التلاعب البارع في TRI: “إجراءنا المعتاد هو تعليم الروبوت في فترة ما بعد الظهر، وتركه يتعلم بين عشية وضحاها، وفي صباح اليوم التالي يكون قادرًا على القيام بالسلوك الجديد”.
يفتح هذا النهج أيضًا الباب أمام إنشاء أنظمة ذكاء اصطناعي قادرة على التعلم بسرعة كيفية القيام بالعديد من المهام، بنفس الطريقة التي تستطيع بها أنظمة الذكاء الاصطناعي التوليدية الأخرى إنشاء مجموعة متنوعة من الصور أو الكتابة حول مجموعة متنوعة من المواضيع.
قال تيدريك: “تتمتع هذه الطريقة بإمكانيات كبيرة لبناء ما نسميه “نماذج سلوكية واسعة النطاق”. “تمامًا كما أحدثت نماذج اللغة واسعة النطاق ثورة في برامج الدردشة الآلية، فإن هذه النماذج السلوكية تسمح للروبوتات بأداء مهام مفيدة بطرق لم تكن قادرة على القيام بها من قبل.”
“نتوقع أن يكون الإنجاز التالي هو عندما يصبحون قادرين على التعميم، وأداء مهارة جديدة لم يتعلموها من قبل.”
التطلع إلى المستقبل: يتمثل أحد القيود في نهج TRI في أن الروبوتات الخاصة بها يمكن أن تواجه صعوبات في إكمال المهام في ظل ظروف تختلف بشكل كبير عن تلك الموجودة في بيانات العرض التوضيحي. على سبيل المثال، الروبوت الذي لم يواجه أي مشكلة في إفراغ كوب من الثلج في حوض مرتب – مثل ذلك الموجود في بيانات العرض التوضيحي – يمكن أن يواجه صعوبة في تفريغه في حوض فوضوي.
يعتقد الباحثون أن الروبوتات الخاصة بهم ستصبح أكثر مرونة عندما يتم تعريفهم ببيانات تدريب أكثر تنوعًا، لذا فهم يقومون حاليًا ببناء ما يسميه تيدريك “روضة أطفال للروبوتات” – يتضمن منهجها العروض التوضيحية اللمسية والمحاكاة الحاسوبية، والهدف هو تعليم الروبوتات المهارات الأساسية التي ستكون مفيدة في العديد من المواقف في العالم الحقيقي.
قال تيدريك: “نتوقع أن يكون الإنجاز التالي هو عندما نقوم بتدريب الروبوتات على ما يكفي من المهارات الحاذقة التي يمكنهم تعميمها، وأداء مهارة جديدة لم يتعلموها من قبل”.
نحن نحب أن نسمع منك! إذا كان لديك تعليق حول هذه المقالة أو إذا كان لديك نصيحة لقصة Freethink المستقبلية، يرجى مراسلتنا عبر البريد الإلكتروني على