كشف باحثون من مركز الذكاء الاصطناعي GrapheneX-UTS في جامعة التكنولوجيا في سيدني (UTS) عن نظام ذكاء اصطناعي ثوري قادر على ترجمة الأفكار الصامتة إلى نص.
هذا المسعى، الذي فتح سبلًا لتعزيز التواصل لأولئك غير القادرين على التحدث بسبب السكتة الدماغية أو الشلل، قاده البروفيسور المتميز سي تي لين، والمؤلف الأول ييكون دوان، وطالب الدكتوراه جينتشو تشو.
وقال لين: “يمثل هذا البحث جهدا رائدا في ترجمة موجات EEG الخام مباشرة إلى اللغة، مما يمثل تقدما كبيرا في هذا المجال”.
وأضاف: “إنها أول من قام بدمج تقنيات التشفير المنفصلة في عملية الترجمة من الدماغ إلى النص، مما يقدم نهجًا مبتكرًا لفك التشفير العصبي. كما أن التكامل مع نماذج اللغة الكبيرة يفتح أيضًا حدودًا جديدة في علم الأعصاب والذكاء الاصطناعي”.
النظام المطور محمول وغير جراحي، على عكس التقنيات السابقة التي تتطلب إجراءات غزوية مثل زراعة الدماغ أو أجهزة التصوير بالرنين المغناطيسي الكبيرة.
إنه يمثل خروجًا عن الأساليب التقليدية من خلال تحقيق التجزئة على مستوى الكلمات دون أدوات مساعدة إضافية مثل تتبع العين، مما يجعله أكثر عملية للاستخدام اليومي.
ارتدى المشاركون في الدراسة قبعة تسجل نشاط الدماغ الكهربائي من خلال مخطط كهربية الدماغ (EEG) أثناء قراءة المقاطع بصمت.
تمت بعد ذلك معالجة بيانات مخطط كهربية الدماغ (EEG) بواسطة نموذج الذكاء الاصطناعي (AI) المسمى DeWave، وهو من ابتكار الباحثين، والذي ترجم إشارات الدماغ إلى كلمات وجمل متماسكة.
تعد هذه التقنية بالوعد للأفراد غير القادرين على التحدث بسبب حالات مختلفة مثل السكتة الدماغية، مما يوفر طريقة اتصال بديلة. بالإضافة إلى ذلك، يمكن أن يسهل التفاعل السلس بين البشر والآلات، مما قد يساعد في تشغيل الأجهزة مثل الأذرع الإلكترونية أو الروبوتات.
وتعزز الدراسة، التي أجريت مع 29 مشاركًا، موثوقية التكنولوجيا وقابليتها للتكيف مقارنة بطرق فك التشفير السابقة، والتي غالبًا ما تم اختبارها على عدد محدود من الأفراد.
إشارات تخطيط كهربية الدماغ (EEG)، التي تم جمعها بغطاء بدلاً من الأقطاب الكهربائية المزروعة، تُحدث بعض الضوضاء. ومع ذلك، وفقًا لفريق البحث، تشير الدراسة إلى أداء متطور في ترجمة مخطط كهربية الدماغ، متجاوزًا المعايير السابقة.
ما هو التالي للفريق
على الرغم من أن النموذج يُظهر كفاءة أعلى في مطابقة الأفعال مع الأسماء، مع ميل نحو الأزواج المترادفة للأسماء، إلا أن الباحثين يعترفون بهذه التحديات.
في الوقت الحالي، تبلغ درجة دقة الترجمة 40% في BLEU-1، وهي مقياس لقياس مدى تشابه النص المترجم آليًا مع الترجمات المرجعية عالية الجودة. ويطمح الفريق إلى تعزيز هذه النتيجة إلى مستوى يضاهي برامج ترجمة اللغات التقليدية أو التعرف على الكلام، والتي تقترب من علامة 90%.
تعتمد هذه التكنولوجيا الرائدة على التطورات السابقة في واجهة الدماغ والحاسوب، مثل الروبوتات رباعية الأرجل التي يتم التحكم فيها بالموجات الدماغية والتي تم تطويرها بالتعاون مع قوات الدفاع الأسترالية.
يمثل دمج إشارات الدماغ في نص ذي معنى خطوة ملحوظة نحو مستقبل حيث يمكن ترجمة الأفكار بسلاسة إلى لغة مكتوبة، مما يحدث ثورة في التواصل للأفراد الذين يواجهون عوائق النطق. تم نشر نتائج الدراسة في مجلة Papers with Code.
via: uts.edu.au