تحقيق إخباري

مشكلةٌ عويصة تواجه تقنيات التعلم العميق

باحثو الذكاء الاصطناعي يحاولون إصلاح عيوب الشبكات العصبية.

دوجلاس هيفِن
  • Published online:

Illustration by Edgar Bąk

تخيَّل سيارةً ذاتية القيادة تقترب من علامة «توقَّف» المرورية، لكنَّها بدلًا من أن تبطئ سرعتها، تُسرع نحو التقاطع المزدحم، ليكشِف تقرير الحادث لاحقًا أنَّه كانت هناك أربعة مستطيلات صغيرة مُلصَقة على العلامة المرورية. وقد ضَلَّلَتْ هذه المستطيلات الأربعة نظام الذكاء الاصطناعي في السيارة، وجعلته يُخطئ في قراءة كلمة «توقَّف» على العلامة المرورية، ويظنها - بدلًا من ذلك - «الحد الأقصى للسرعة 45».

لم يقع هذا الحادث حقًّا، لكنْ من الممكن بالفعل عرقلة عمل أنظمة الذكاء الاصطناعي، إذ أوضح الباحثون كيف يمكن خداع نظام ذكاءٍ اصطناعي؛ ليُخطئ في قراءة علامة «توقَّف» المرورية، وذلك بوضع ملصقاتٍ عليها بعناية1. وتمكنوا من تضليل أنظمة التعرف على الوجوه، عن طريق لصق أشكال مطبوعة على النظارات أو القبعات. كما احتالوا على أنظمة التعرف على الكلام بدفعها إلى تخيُّل سماع عباراتٍ وهمية، عن طريق إقحام أنماطٍ من الضجيج الأبيض في الأصوات التي تسمعها.

هذه مجرد أمثلة على مدى سهولة عرقلة عمل التقنية الرائدة للتعرف على الأنماط في الذكاء الاصطناعي، المعروفة باسم الشبكات العصبية العميقة (DNNs). وقد أثبتت هذه الشبكات قدرتها المذهلة على تصنيف جميع أنواع المدخلات بشكلٍ صحيح، بما في ذلك الصور، والكلام، والبيانات المتعلقة بتفضيلات المستهلكين. وهي جزء من الحياة اليومية، إذ تدير كل شيء، بدءًا من أنظمة الهاتف المشغلة تلقائيًّا، حتى تقديم التوصيات إلى مستخدمي خدمة البث «نتفليكس» Netflix. ومع ذلك.. فإنَّ تعديل المدخلات بتغييراتٍ بسيطة للغاية لا يلاحظها البشر عادةً يمكن أن يُربِك أفضل الشبكات العصبية.

وعلى حد قول دان هندريكس، طالب الدكتوراة في علوم الحاسوب بجامعة كاليفورنيا في مدينة بيركلي الأمريكية، فإنَّ هذه المشكلات مقلقةٌ أكثر من أي سماتٍ غريبة وشاذة تُظْهِرها تقنيةٌ غير مثاليةٍ بعد كهذه. ومثل عديدٍ من العلماء، أصبح هندريكس يرى أنَّ هذه المشكلات هي أوضح مثالٍ على الطبيعة الواهية للشبكات العصبية العميقة؛ فهي تؤدي مهامها ببراعة، إلى أنْ تواجه موقفًا غير مألوف، فتتعطل؛ وتُخطئ بطرقٍ غير متوقعة (انظر الشكل: «خداع الذكاء الاصطناعي»).

كبر الصورة

Sources: Stop sign: Ref. 1; Penguin: Ref. 5

يمكن أن يتسبب هذا في مشكلاتٍ كبيرة.. فأنظمة التعلم العميق تخرج على نحوٍ متزايد من المختبرات لتنتقل إلى حيز التطبيق في العالم الفعلي، بدايةً من أنظمة توجيه السيارات ذاتية القيادة إلى تشخيص الأمراض وتحليل أنماط ارتكاب الجرائم. وحسبما أفادت دراسةٌ جديدة تمّت خلال هذا العام2، فإنَّ إضافة بكسلاتٍ مُضَلِّلة إلى صور الفحوص الطبية قد تخدع الشبكة العصبية العميقة، وتجعلها تخلص إلى تشخيص خاطئ بالإصابة بمرض السرطان. وقد أشارت دراسةٌ أخرى إلى أنَّ نقاط الضعف تلك ربما يستغلها أحد قراصنة شبكة الإنترنت، للسيطرة على نظامٍ مبنِيّ على الذكاء الاصطناعي بالشبكة، بحيث يدفع النظام إلى تشغيل خوارزمياته الخاصة3.

وفي مسعى الباحثين إلى تحديد مواطن الخلل تلك، اكتشفوا الكثير عن أسباب حالات إخفاق الشبكات العصبية العميقة في مهمتها. ويرى فرانسوا شوليه - مهندس الذكاء الاصطناعي في شركة «جوجل» بمدينة ماونتن فيو في ولاية كاليفورنيا - أنَّه "لا توجد حلول للطبيعة الواهية للشبكات العصبية العميقة". ويقول هو وآخرون، إنَّه من أجل تجاوُز تلك العيوب، يحتاج الباحثون إلى تعزيز الشبكات العصبية العميقة التي تتحرى التطابق بين الأنماط بقدراتٍ إضافية. وعلى سبيل المثال.. بتطوير أنظمة ذكاء اصطناعي تستطيع استكشاف العالَم بنفسها، وكتابة أكواد برامجها الخاصة، والاحتفاظ بالذكريات. ويَعتقِد بعض الخبراء أنَّ هذه الأنواع من النظم ستشكل مستقبل أبحاث الذكاء الاصطناعي في العقد القادم.

الحقيقة الصادمة

كشفت شركة «جوجل» في عام 2011 أنَّها طورت نظامًا يمكنه التعرف على القطط في مقاطع الفيديو على موقع «يوتيوب» YouTube. وبعد فترةٍ وجيزة، ظهرت مجموعةٌ كبيرة من أنظمة التصنيف المعتمدة على الشبكات العصبية العميقة. وعن ذلك يقول جيف كلون، من جامعة وايومينج في مدينة لارامي الأمريكية، وأحد كبار مديري الأبحاث في مختبرات أوبر للذكاء الاصطناعي بمدينة سان فرانسيسكو في ولاية كاليفورنيا: "كان الجميع يقولون: "يا للمفاجأة! هذا رائع، أصبحت الحواسيب قادرةً أخيرًا على فهْم العالم"".

كان باحثو الذكاء الاصطناعي يدركون أنَّ الشبكات العصبية العميقة لا تفهم العالَم فعليًّا، فهي بِنًى برمجية مكونة من أعداد كبيرة من الخلايا العصبية الرقمية، مرتَّبة في عددٍ كبير من الطبقات لتشبه بنية المخ في بعض تفاصيلها. وتتصل كل خلية عصبية بخلايا أخرى في الطبقات، أعلاها، وأسفلها.

وتكمن فكرة عمل هذه الشبكات في أنَّ بعضًا من سمات المدخلات الأولية التي تصل إلى الطبقات السفلية - مثل البكسلات في صورةٍ ما - يحفِّز بعضًا من تلك الخلايا العصبية. وهذه الخلايا ترسل بدورها إشارةً إلى الخلايا العصبية في الطبقة الأعلى، وفقًا لقواعد رياضية بسيطة. ويتضمن تدريب شبكةٍ عصبية عميقة تعريضها لمجموعةٍ ضخمة من الأمثلة، مع تعديل الطريقة التي ترتبط بها الخلايا العصبية ببعضها البعض في كل مرة، بحيث تصل الطبقة العليا في النهاية إلى الإجابة المطلوبة، كأنْ تتعرف على صورة الأسد في كل مرة مثلًا، حتى لو لم تكن الشبكة العصبية العميقة قد رأت هذه الصورة من قبل.

جاء أول إنذار لينبِّه بشكل كبير إلى الحقيقة الصادمة لهذه الشبكات في عام 2013، عندما نشر كريستيان سيجيدي - الباحث في شركة «جوجل» - وزملاؤه نسخة ما قبل النشر لبحثٍ بعنوان «السمات المثيرة للاهتمام في الشبكات العصبية»4، إذ أوضح الفريق أنَّه من الممكن استخدام صورةٍ تستطيع الشبكة العصبية العميقة التعرف عليها، كصورة أسد على سبيل المثال، وخداع الشبكة لتراها شيئًا مختلفًا، كمكتبة على سبيل المثال، وذلك من خلال تغيير عددٍ قليل من البكسلات. وقد أطلق الفريق على هذه الصور المعدَّلة اسم «الأمثلة الخادعة».

كبر الصورة

وبعد ذلك بعام، أوضح كلون، وآن نوين، الذي كان يدرس تحت إشرافه حينها، ومعهما جيسون يوسينسكي من جامعة كورنيل في مدينة إيثاكا بولاية نيويورك الأمريكية، أنَّه من الممكن جعل الشبكات العصبية العميقة تتخيل رؤية أشياءٍ غير موجودة في الحقيقة، كأنْ ترى بطْريقًا في نمطٍ من الخطوط المتموجة5. ويوضح يوشوا بنجيو - من جامعة مونتريال الكندية، ويُعَد رائدًا في مجال التعلم العميق - هذا قائلًا: "أيُّ شخصٍ جرَّب أنظمة تعلُّم الآلة يَعلَم أنَّ هذه الأنظمة ترتكب أخطاءً سخيفة من حينٍ إلى آخر. وقد تمثلت المفاجأة في نوع هذه الأخطاء. كان نوعها مدهشًا إلى حد كبير، فهو نوعٌ من الأخطاء لم نكن لنتخيل حدوثه".

وتَوالَى بعدها سريعًا ظهور عددٌ كبير من أنواع الأخطاء الجديدة. ففي العام الماضي، أوضح نوين - الذي يعمل حاليًا في جامعة أوبورن بولاية ألاباما الأمريكية - أنَّ مجرد تدوير الأشياء في صورةٍ ما كان كافيًا لتضليل  بعضٍ من أفضل أنظمة تصنيف الصور6. وهذا العام، أفاد هندريكس وزملاؤه بأنَّه حتى الصور الطبيعية غير المعدَّلة يمكنها خداع أحدث برامج التصنيف، وإيقاعها في زلّاتٍ محرجة، لا يمكن التنبؤ بها، مثل تصنيف فطر في صورةٍ ما على أنَّه قطعة من معجنات البريتزل، أو تصنيف حشرة يعسوب على أنَّها غطاء بالوعة7.

كبر الصورة

تتجاوز المشكلة مسألة التعرف على الأشياء، إذ إن أي نظام ذكاء اصطناعي يستخدم الشبكات العصبية العميقة لتصنيف المدخلات، مثل الكلام، يمكن خداعه. ويمكن أيضًا عرقلة عمل برامج الذكاء الاصطناعي التي تُستخدم في ألعاب الفيديو. ففي عام 2017، على سبيل المثال، ركزت عالمة الحاسوب ساندي هوانج - وهي طالبة دكتوراة في جامعة كاليفورنيا بمدينة بيركلي الأمريكية - وزملاؤها على الشبكات العصبية العميقة التي دُرِّبَت على الفوز في ألعاب الفيديو بأجهزة الـ«أتاري»، من خلال عمليةٍ تسمَّى «التعلم التعزيزي»8. وفي هذا النهج، يُوضَع هدفٌ لنظام الذكاء الاصطناعي. وعبر الاستجابة لمجموعة من المدخلات، يتعلم النظام - من خلال التجربة، والخطأ - ما ينبغي فعله للوصول إلى هذا الهدف. وهذه هي التقنية التي تستند إليها برامج الذكاء الاصطناعي الخارقة الممارِسة للألعاب، مثل «ألفا زيرو» AlphaZero، وروبوت لعبة البوكر «بلوريباس» Pluribus. ومع ذلك.. استطاع فريق هوانج أن يجعل برامج الذكاء الاصطناعي تخسر في الألعاب، عن طريق إضافة بكسل عشوائي أو اثنين إلى الشاشة.

وفي وقتٍ سابق من هذا العام، أوضح آدم جليف - طالب الدكتوراة في مجال الذكاء الاصطناعي بجامعة كاليفورنيا في مدينة بيركلي الأمريكية – وزملاؤه أنَّه من الممكن إقحام عنصرٍ في بيئة نظم ذكاء اصطناعي، لينفِّذ «سياسةً خادعة» مُصمَّمة لتُرْبِك استجابات هذه النظم9؛ فعلى سبيل المثال.. في بيئة محاكاة، في نظام ذكاء اصطناعي مخصص لألعاب كرة القدم، نلحظ أن اللاعبين، المُدرَّبين على ركل الكرة لتستقر في مرمى يحرسه حارس مرمى في النظام، يفقدون قدرتهم على تسجيل الأهداف عندما يبدأ حارس المرمى في التصرف بطرقٍ غير متوقعة، مثل السقوط على الأرض.

هذا بالإضافة إلى أنَّ معرفة نقاط الضعف في شبكةٍ عصبية عميقة يمكن أن تسمح لمخترقٍ بالسيطرة على برنامج ذكاءٍ اصطناعي قوي. وقد شهد العام الماضي أحد الأمثلة على ذلك، عندما أوضح فريقٌ من شركة «جوجل» أنَّه من الممكن استخدام «أمثلةٍ خادعة»، ليس فقط لدفع الشبكة العصبية العميقة لارتكاب أخطاءٍ محددة، لكنْ أيضًا لإعادة برمجتها بالكامل، أي إعادة تهيئة برنامج الذكاء الاصطناعي المدرَّب على مهمةٍ معينة فعليًّا؛ لأداء مهمةٍ أخرى3.

ويمكن - من حيث المبدأ - استخدام الكثير من الشبكات العصبية - كتلك التي تتعلم فهْم اللغة – لكتابة كود أي برنامجٍ حاسوبي آخر. ويقول كلون عن ذلك: "من الناحية النظرية، يمكنك تحويل روبوت دردشة إلى أي برنامج تريده. وهذا هو المدهش". ويتخيل كلون موقفًا في المستقبل القريب، يمكن فيه لقراصنة الإنترنت اختراق شبكاتٍ عصبية في السحابة الإلكترونية، لتشغيل خوارزمياتهم الروبوتية المراوِغة، وإرسال مواد غير مرغوب فيها إلى مستخدمي شبكة الإنترنت.

وترى داون سونج - عالمة الحاسوب في جامعة كاليفورنيا بمدينة بيركلي - أن الشبكات العصبية العميقة تمثل هدفًا سهلًا، وتضيف  موضحةً: "هناك  طرق عديدة مختلفة يمكنك استخدامها لمهاجمة نظامٍ ما. والدفاع عن هذه الأنظمة صعب للغاية".

نقمة في ثوب نعمة

تتسم الشبكات العصبية العميقة بالفاعلية، لأنَّ طبقاتها الكثيرة تعني أنَّ بإمكانها ملاحظة الأنماط في سماتٍ كثيرة مختلفة من سمات المدخلات عند محاولة تصنيف مدخل ما. فعلى سبيل المثال.. ربما يجد نظام الذكاء الاصطناعي المُدرَّب على التعرف على الطائرات أنَّ سماتٍ معينة، مثل الرقع الملونة، أو التركيب، أو الخلفية هي سماتٌ مميزة بقوة للطائرات، تكافئ في دلالتها السمات الأخرى التي قد نعتبرها واضحة، مثل الأجنحة، لكنَّ هذا يعني أيضًا أنَّ أي تغييرٍ بسيط جدًّا في المدخلات يمكن أن يحولها إلى ما يعتبره نظام الذكاء الاصطناعي حالةً مختلفةً تمامًا.

أحد حلول تلك المشكلة هو - ببساطة - تدريب نظام الذكاء الاصطناعي على قَدْرٍ أكبر من البيانات؛ وعلى وجه التحديد.. تعريض النظام مرارًا وتكرارًا لحالاتٍ إشكالية، وتصحيح أخطائه. وفي هذا النوع من «التدريب بالمدخلات الخادعة»، بينما تتعلم شبكةٌ التعرفَ على الأشياء، تحاول أخرى تغيير المدخلات؛ لخداعها، وإيقاعها في الخطأ. وبهذه الطريقة تصبح الأمثلة الخادعة جزءًا من بيانات تدريب الشبكة العصبية العميقة.

وقد اقترح هندريكس وزملاؤه تحديد مدى متانة أي شبكة عصبية عميقة، وقدرتها على تجنب ارتكاب الأخطاء، من خلال اختبار أدائها حين تتعرض لمجموعةٍ كبيرة من الأمثلة الخادعة. ومع ذلك.. فهم يرون أنَّ تدريب أي شبكةٍ على التصدي لنوعٍ واحد من الهجمات يمكن أن يُضعِف قدرتها على مواجهة الأنواع الأخرى. ويحاول باحثون من شركة «جوجل ديب مايند» Google DeepMind في لندن، بقيادة عالم الحاسوب بوشميت كولي، أن يحصنوا الشبكات العصبية العميقة ضد ارتكاب الأخطاء. فالكثير من الهجمات المعتمدة على الأمثلة الخادعة يُنَفَّذ عن طريق إجراء تعديلاتٍ دقيقة على الأجزاء المُكوِّنة لأحد المدخلات - مثل تغيير لون البكسلات في صورةٍ ما بدرجةٍ بسيطة غير ملحوظة – حتى تُخطئ الشبكة العصبية العميقة في تصنيفه. ويرى فريق كولي أنَّ أي شبكة عصبية عميقة متينة يُفترَض ألا تغير نتائجها عند وجود تغيراتٍ طفيفة في مدخلاتها، وأنَّ هذه الخاصية ربما يمكن دمجها حسابيًّا في الشبكة، لوضع ضوابط لآلية تعلمها.

ومع ذلك.. لا أحد في الوقت الحالي يملك حلًّا للمشكلة العامة المتمثلة في الطبيعة الواهية لأنظمة الذكاء الاصطناعي. ويرى بنجيو أنَّ أساس المشكلة هو أنَّ الشبكات العصبية العميقة ليس لديها نموذجٌ فعال تعتمد عليه في اختيار العناصر المهمة في المدخلات. فعندما يصنف نظام الذكاء الاصطناعي صورةً معدلة لأسد على أنَّها صورةٌ لمكتبة، تظل صورة أسد بالنسبة إلى الشخص العادي، لأنَّ لديه نموذجًا عقليًّا للحيوان يستند إلى مجموعةٍ من السمات رفيعة المستوى، مثل الأذنين، والذيل، واللبدة، وما إلى ذلك. وهذا يتيح له تجاهل التفاصيل العشوائية - أو العَرَضية - منخفضة المستوى. ويضيف بنجيو قائلًا: "نعرف من التجارب السابقة أي السمات أكثر وضوحًا. وهذا ينبع من فهْمٍ عميق لبِنْية العالم".

تتمثل إحدى المحاولات الممكنة لحل هذه المشكلة في دمج الشبكات العصبية العميقة مع ما يُعرف باسم «الذكاء الاصطناعي الرمزي»، الذي كان يُعَد النموذج السائد في حقل الذكاء الاصطناعي قبل تعلُّم الآلة. وفي أنظمة الذكاء الاصطناعي الرمزي، كانت الآلات تفكر باستخدام قواعد برمجية ثابتة تتعلق بطبيعة العالم، منها مثلًا أنَّه يحتوي على أشياء مختلفة، وأنَّها مرتبطة ببعضها بطرقٍ عديدة. ويرى بعض الباحثين، مثل عالِم النفس جاري ماركوس، الأستاذ بجامعة نيويورك الأمريكية، أنَّ نماذج الذكاء الاصطناعي الهجينة هي الحل. يقول ماركوس، الذي ينتقد نهج التعلم العميق الحالي منذ زمنٍ طويل: "التعلم العميق مفيد للغاية على المدى القصير، لدرجة أنَّ الناس أصبحوا لا يضعون المدى الطويل في اعتبارهم". وجديرٌ بالذكر أنَّه في شهر مايو من العام الجاري، شارك ماركوس في تأسيس شركة ناشئة، تُدعى «روباست إيه آي» Robust AI في مدينة بالو ألتو بولاية كاليفورنيا الأمريكية، وهي شركة تهدف إلى مزج التعلم العميق بتقنيات الذكاء الاصطناعي القائمة على قواعد، لتطوير روبوتات يمكنها العمل بأمان جنبًا إلى جنب مع البشر، لكنْ ما تعمل عليه الشركة بالضبط ما زال طيّ الكتمان.

وحتى إذا أمكن تضمين القواعد في الشبكات العصبية العميقة، فلن تكون مفيدة، إلا بقدر البيانات التي تتعلم منها هذه الشبكات. ويقول بنجيو عن ذلك إنَّ أنظمة الذكاء الاصطناعي تحتاج إلى التعلم في بيئاتٍ أكثر ثراءً يمكنها استكشافها. وعلى سبيل المثال.. تفشل غالبية أنظمة الرؤية الحاسوبية في إدراك أنَّ علبة الجعة أسطوانية الشكل، لأنَّها دُرِّبَت على مجموعات بيانات مكوَّنة من صور ثنائية الأبعاد. ولهذا.. وجد نويِن وزملاؤه أنَّه من السهل خداع الشبكات العصبية العميقة بتعريضها لأشياءٍ مألوفة من زوايا مختلفة. والتعلم في بيئةٍ ثلاثية الأبعاد قد يساعد على حل تلك المشكلة، سواءٌ أكانت تلك البيئات حقيقيةً، أم في صورة محاكاة.

إنّ الطريقة التي يتعلم بها الذكاء الاصطناعي أيضًا بحاجة إلى التغيير. وحول ذلك.. يقول بنجيو: "العلاقات السببية يجب أن تتعلمها كيانات فاعلة في العالم، يمكنها التجربة والاستكشاف". ويتفق معه يورجن شميدهوبر، أحد رواد مجال التعلم العميق، الذي يعمل بمعهد دال مول لأبحاث الذكاء الاصطناعي في مانو بسويسرا. يرى شميدهوبر أنَّ تقنيات التعرف على الأنماط فعالة للغاية، وجيدة لدرجة أنَّها جعلت شركاتٍ مثل «علي بابا» Alibaba، و«تينسنت» Tencent، و«أمازون» Amazon، و«فيسبوك» Facebook، و«جوجل» الشركات الأعلى قيمةً في العالم، لكنَّه يضيف قائلًا إنّ "هناك موجةً قادمة أكبر بكثير، ستتمحور حول آلاتٍ تتفاعل مع العالم، وتجمع بياناتها الخاصة من خلال تصرفاتها".

وإلى حدٍ ما، فإنَّ أنظمة الذكاء الاصطناعي التي تستخدم التعلم التعزيزي للفوز في ألعاب الحاسوب تفعل ذلك بالفعل في بيئاتٍ اصطناعية؛ فاعتمادًا على التجربة والخطأ، تعالج هذه الأنظمة البكسلات على الشاشة بطرقٍ معينة مسموح بها، حتى تصل إلى الهدف المطلوب، لكنَّ البيئات الحقيقية أكثر ثراءً بكثير من مجموعات البيانات المستمدة من محاكاة، أو المنسقة بعناية، التي تتدرب عليها غالبية الشبكات العصبية العميقة اليوم.

روبوتات قادرة على الارتجال

في مختبرٍ بجامعة كاليفورنيا في مدينة بيركلي الأمريكية، راح ذراعٌ آليّ يفتش وسط كومةٍ من الأغراض المبعثرة؛ فالتقط وعاءً أحمر، واستخدمه لدفع قفاز فرنٍ أزرق اللون بضعة سنتيمترات إلى اليمين، ثم ترك الوعاء، والتقط بخاخةً بلاستيكية فارغة. وبعدها، أخذ يستكشف وزن كتابٍ ذي غلافٍ ورقي، وشكله. وعلى مدار عدة أيامٍ من التمحيص المستمر، بدأ الروبوت في اعتياد هذه الأشياء الغريبة، وفهْم ما يمكن أن يفعله بها.

يستخدم هذا الذراع الآليّ التعلم العميق ليتعلم استخدام الأدوات. فحين أُعطيَ صينيةً بها بعض الأغراض، راح يلتقطها، ويفحص كلٍ منها على حدة، ويرى ما يحدث عندما يحركها ويصدم أحدها بالآخر.

وعندما يضع الباحثون للروبوت هدفًا ما، كأنْ يعرضوا عليه مثلًا صورةً لصينية شبه فارغة، ويطلبوا منه ترتيب الأغراض لتطابِق الحالة في الصورة، فإنَّه يرتجل، ويستطيع استخدام أغراضٍ لم يسبق له أن رآها من قبل، فيستخدم مثلًا إسفنجةً لإزالة الأغراض من على طاولة. اكتشف الروبوت أيضًا أنَّ إزالة الأغراض من خلال إزاحتها بزجاجة مياه بلاستيكية أسرع من التقاطها مباشرةً. وفي هذا الصدد.. تقول تشيلسي فين، التي عملت في مختبر بيركلي، وتستكمل الآن هذا البحث في جامعة ستانفورد بكاليفورنيا: "مقارنةً بتقنيات تعلُّم الآلة الأخرى، فإنَّ ما يمكنه تحقيقه - بوجه عام - ما زال يدهشني".

وترى فين أنَّ هذا النوع من التعلم يُكسِب الذكاء الاصطناعي فهْمًا أعمق للأشياء، وللعالَم عمومًا. فلو رأيت زجاجة ماء، أو إسفنجة فقط في صورٍ فوتوغرافية، ربما يمكنك التعرف عليهما في صورٍ أخرى، لكنَّك لن تفهم حقًّا ماهيّتهما، أو استخداماتهما الممكنة. وتضيف: "سيكون فهْمك للعالَم أكثر سطحيةً بكثير مما لو كان بإمكانك التفاعل مع هذه الأغراض".

إنّ هذا النوع من التعلم يجري ببطء. ففي المحاكاة، يستطيع برنامج الذكاء الاصطناعي أنْ يعالج الأمثلة بسرعة البرق. فعلى سبيل المثال.. في عام 2017، تدرَّب «ألفا زيرو» - أحدث إصدار من برامج التعلم الذاتي الممارِسة للألعاب، الذي أنتجته شركة «جوجل ديب مايند» - ليصبح لاعبًا ذا مهاراتٍ استثنائية في لعبة «جو» Go، ثم لعبة الشطرنج، وبعدها لعبة «شوجي» shogi (وهي نوعٌ من الشطرنج الياباني) في يومٍ واحدٍ فحسب. ولعب البرنامج خلال هذا الوقت أكثر من 20 مليون مباراة تدريبية بكل لعبة.

هذا.. ويُذكر أنه لا يمكن لروبوتات الذكاء الاصطناعي أن تتعلم بهذه السرعة. يقول جيف مالر - الشريك المؤسس لشركة الذكاء الاصطناعي والروبوتات «أمبيدكستروس» Ambidextrous بمدينة بيركلي في ولاية كاليفورنيا الأمريكية - إنَّ جميع النتائج الكبرى في التعلم العميق تقريبًا اعتمدت - إلى درجةٍ كبيرة - على كمياتٍ ضخمة من البيانات. وأضاف: "سيستغرق الروبوت الواحد مدة طويلة غير منقطعة؛ لتنفيذ المهمة، تصل إلى سنواتٍ؛ ليجمع عشرات الملايين من نقاط البيانات". والأدهى من ذلك.. أنَّ البيانات ربما لا تكون موثوقةً، لأنَّ معايرة أجهزة الاستشعار يمكن أن تتغير بمرور الوقت، وربما تتدهور حالة المكونات المادية للروبوت.

ولهذا السبب.. فإنَّ غالبية أبحاث الروبوتات التي تعتمد على تقنية التعلم العميق ما زالت تستخدم بيئات المحاكاة لتسريع عملية التدريب. ويقول ديفيد كِنت، طالب الدكتوراة في علم الروبوتات بمعهد جورجيا للتكنولوجيا في مدينة أتلانتا الأمريكية: "ما يمكن تعلُّمه يعتمد على جودة أجهزة المحاكاة». وهذه الأجهزة في تطورٍ مستمر، وتزداد مع الوقت قدرة الباحثين على نقل الدروس التي يتعلمها الذكاء الاصطناعي في العوالم الافتراضية إلى العالم الواقعي، لكنْ تظل المحاكاة غير قادرةٍ على مضاهاة تعقيدات العالَم الحقيقي.

وترى فين أنَّ توسيع نطاق التعلم باستخدام الروبوتات هو - في نهاية المطاف - أسهل من التعلم باستخدام البيانات الاصطناعية، إذ استغرق روبوتها الذي يستخدم الأدوات أيامًا قليلة لتعلم مهمةٍ بسيطة نسبيًّا، لكنَّه لم يتطلب متابعةً مكثفة. وعن ذلك تقول: "عليك أنْ تشغل الروبوت فقط، وتتابع عمله نوعًا ما من حينٍ إلى آخر". وتتخيل أنَّها ذات يوم سيكون لديها الكثير من الروبوتات في العالم الخارجي، تتعلم ذاتيًّا على مدار الساعة، دون تدخُّلٍ، أو مساعدة. ومن المفترض بهذا أن يكون ممكنًا. ففي النهاية، هذه هي الطريقة التي يفهم بها البشر العالَم. ويضيف شميدهوبر: "لا يتعلم الطفل عن طريق تحميل البيانات من موقع «فيسبوك»".

التعلم من بياناتٍ أقل

يستطيع الطفل أيضًا التعرف على أمثلةٍ جديدة من نقاط بياناتٍ قليلة؛ فحتى لو لم ير الطفل زرافةً من قبل، ما زال بإمكانه التعرف عليها بعد رؤيتها مرةً، أو مرتين. ويرجع سبب النجاح السريع في تلك المهمة جزئيًّا إلى أنَّ الطفل قد رأى العديد من الكائنات الحية الأخرى، وإنْ لم تكن زرافات، ولهذا.. فهو بالفعل على دراية بسماتها البارزة.

وثمة مصطلحٌ شامل لتزويد الذكاء الاصطناعي بهذه الأنواع من القدرات، وهو «التعلم بالنقل»؛ وتتمثل فكرة التعلم بالنقل في نقل المعرفة المكتسَبة من جولات تدريبٍ سابقة إلى مهمةٍ أخرى. وإحدى وسائله لذلك هي إعادة استخدام شبكةٍ مدرَّبة مسبقًا، أو جزءٍ منها، كنقطة بداية عند تدريب نظام الذكاء الاصطناعي على مهمةٍ جديدة. على سبيل المثال.. إعادة استخدام أجزاءٍ من شبكة عصبية عميقة مُدرَّبة بالفعل على التعرف على نوعٍ من الحيوانات - مثل تلك الطبقات من الشبكة التي تتعرف على الشكل الأساسي لجسم الحيوان – يمكنه أن يمنح شبكةً جديدة الأفضلية عند تعلُّم التعرف على الزرافة.

وهناك نوعٌ غير معتاد من التعلم بالنقل، يهدف إلى تدريب شبكةٍ جديدة من خلال عرض عددٍ قليل من الأمثلة عليها، وأحيانًا مثالٌ واحد فقط. يُعرف هذا النوع باسم «التعلم بمثالٍ واحد»، أو «التعلم ببضعة أمثلة»، ويعتمد بصورة مكثفة على شبكاتٍ عصبية عميقة مُدرَّبة مسبقًا. تخيَّل مثلًا أنَّك تريد تطوير نظامٍ للتعرف على الأوجه، يمكنه التعرف على الأشخاص في قاعدة بياناتٍ جنائية. إحدى الطرق السريعة لفعل ذلك هي استخدام شبكة عصبية عميقة شاهدت بالفعل ملايين الوجوه (ليس بالضرورة تلك الوجوه الموجودة في قاعدة البيانات)، بحيث تكون لديها فكرة جيدة عن السمات البارزة للأوجه، مثل أشكال الأُنوف، والفُكوك. وبهذا.. عندما تنظر الشبكة إلى صورةٍ واحدة فقط لوجهٍ جديد، يمكنها استخراج مجموعة سماتٍ بارزة مفيدة منها، ومن ثم مقارنة مدى التشابه بين هذه المجموعة من السمات، والسمات التي تميز صور قاعدة البيانات الجنائية، والعثور على أقرب شبيه.

إنّ امتلاك ذاكرةٍ مدرَّبة مسبقًا كهذه يمكن أن يساعد أنظمة الذكاء الاصطناعي في التعرف على الأمثلةٍ الجديدة، دون الحاجة إلى رؤية الكثير من الأنماط، وهذا من الممكن أن يُسرِّع عملية التعلم باستخدام الروبوتات، لكنْ ربما ترتبك هذه الشبكات العصبية العميقة عندما تواجه أي مثال بعيد للغاية عن نطاق ما اختبرته. وما تزال حدود قدرة تلك الشبكات على التعميم غير واضحة.

وحتى أنجح أنظمة الذكاء الاصطناعي، مثل «ألفا زيرو»، الذي طورَتْه شركة «ديب مايند»، يُعَد نطاق خبراتها ضيقًا للغاية، إذ يمكن تدريب خوارزمية «ألفا زيرو» على ممارسة لعبة «جو»، ولعبة الشطرنج، لكنْ ليس كلتيهما في الوقت ذاته. وإعادة تدريب شبكات نموذجٍ ما واستجاباته ليتمكن من الفوز في لعبة الشطرنج تعيد أي خبراتٍ سابقة كانت لديه في لعبة «جو» إلى نقطة الصفر. وعن ذلك.. تقول فين: "إذا فكرتَ في الأمر من منظورٍ بشريّ، ستجده مثيرًا للسخرية نوعًا ما". فالبشر لا ينسون ما تعلموه بهذه السهولة.

تعلُّم كيفية التعلُّم

لم يكن نجاح «ألفا زيرو» في ممارسة الألعاب يرجع فقط إلى فعالية تقنية التعلم التعزيزي، التي تدرَّب باستخدامها، لكنْ أيضًا إلى خوارزميةٍ ساعدته في تضييق نطاق خياراته من الخطوات التالية المحتملة10 (باستخدام نوعٍ من تقنية البحث المعروفة باسم «شجرة مونت كارلو»). وبمعنًى آخر.. حظي نظام الذكاء الاصطناعي بتوجيهٍ حول الطريقة المثلى للتعلم من بيئته. ويعتقد شوليه أنّ الخطوة التالية المهمة في مجال الذكاء الاصطناعي ستكون مَنْح الشبكات العصبية العميقة القدرة على كتابة الخوارزميات الخاصة بها كهذه الخوارزمية، بدلًا من استخدام كودٍ وضعه البشر.

ويرى شوليه أنه إذا جرى تعزيز القدرات الأساسية التي تكمن وراء تحرِّي التطابُق بين الأنماط في أنظمة الذكاء الاصطناعي بقدرات الاستدلال والتفكير المنطقي، فهذا من شأنه أن يجعلها أفضل في التعامل مع المدخلات خارج نطاق خبراتها. وقد دَرَس علماء الحاسوب لسنواتٍ تقنيات «التصميم الآلي للبرامج»، التي يُولِّد فيها حاسوبٌ كودَ برنامجٍ ما أوتوماتيكيًّا. ويعتقد الباحث أنَّ دمج هذا المجال مع التعلم العميق يمكن أن يُنتِج أنظمةً ذات شبكاتٍ عصبية عميقة، أقرب بكثير إلى النماذج الذهنية المجرَّدة، التي يستخدمها البشر.

ففي علم الروبوتات مثلًا، تعمل عالمة الحاسوب كريستِن جرومان - من مركز أبحاث فيسبوك للذكاء الاصطناعي بمدينة مينلو بارك في ولاية كاليفورنيا الأمريكية، والأستاذة بجامعة تكساس في مدينة أوستن - على تعليم الروبوتات أفضل السبل لاستكشاف بيئاتٍ جديدة بنفسها. وقد يتضمن هذا مثلًا تحديد الاتجاهات التي ينبغي لها أن تنظر فيها عندما تُوجَد في بيئاتٍ جديدة، وطريقة التعامل مع جسمٍ ما لفَهْم شكله، أو غرضه، على أفضل وجه. وتتمثل الفكرة هنا في جعل الذكاء الاصطناعي يتكهن.. أيّ منظورٍ أو زاويةٍ جديدة ستوفر له أنفع البيانات الجديدة ليتعلم منها.

ويقول الباحثون في هذا المجال إنَّهم يحرزون تقدمًا في إصلاح عيوب التعلم العميق، لكنَّهم يُقِرُّون بأنَّهم ما زالوا يتلمسون طريقهم لاكتشاف تقنياتٍ جديدة للتغلب على الطبيعة الواهية لهذا التعلُّم. وترى سونج أنَّه لا يوجد سوى قدرٍ بسيط من النظريات في مجال التعلم العميق، وتضيف قائلة: "إذا فشلت تجربة ما، فمِن الصعب معرفة السبب. إنّ المجال بأكمله ما زال تجريبيًّا، وما عليك سوى التجربة".

ورغم أنَّ العلماء يدركون الطبيعة الواهية للشبكات العصبية العميقة، واعتمادها على كمياتٍ ضخمة من البيانات، فإنَّ معظمهم يقولون - في الوقت الحالي - إنَّ استخدام التقنية سيستمر لفترةٍ طويلة. وإدراك أنَّ الشبكات العصبية يمكن تدريبها للتعرف على الأنماط بهذه الكفاءة، حين تُدمج مع موارد حوسبية هائلة، يظل اكتشافًا كبيرًا في هذا العقد، لكنّ كلون يقول: "لا يوجد أحد لديه أيّ فكرة عن كيفية تحسينها".

References

  1. Eykholt, K. et al. IEEE/CVF Conf. Comp. Vision Pattern Recog. 2018, 1625–1634 (2018). | article
  2. Finlayson, S. G. et al. Science 363, 1287–1289 (2019). | article
  3. Elsayed, G. F., Goodfellow, I. & Sohl-Dickstein, J. Preprint at https://arxiv.org/abs/1806.11146 (2018)
  4. Szegedy, C. et al. Preprint at https://arxiv.org/abs/1312.6199v1 (2013)
  5. Nguyen, A., Yosinski, J. & Clune, J. IEEE Conf. Comp. Vision Pattern Recog. 2015, 427–436 (2015). | article
  6. Alcorn, M. A. et al. IEEE Conf. Comp. Vision Pattern Recog. 2019, 4845–4854 (2019)  | article
  7. Hendrycks, D., Zhao, K., Basart, S., Steinhardt, J. & Song, D. Preprint at https://arxiv.org/abs/1907.07174 (2019)

  8. Huang, S., Papernot, N., Goodfellow, I., Duan, Y. & Abbeel, P. Preprint at https://arxiv.org/abs/1702.02284 (2017)
  9. Gleave, A. et al. Preprint at https://arxiv.org/abs/1905.10615 (2019)

  10. Silver, D. et al. Science 362, 1140–1144 (2018). | article

دوجلاس هيفِن كاتب مستقل، مقيم في لندن