أنباء وآراء

الهندسة: مِشْبَكان عصبيان اصطناعيان أفضل من واحد

قد تُحْدِث الأجهزة النانوية الإلكترونية الناشئة ثورة في مجال الشبكات العصبية الاصطناعية، لكنّ تطبيقاتها المادية ظلت متأخرة عن تطبيقات نظائرها البرمجية. وقد تم تطوير نهج؛ لقلب الموازين لصالحها.

جينا سي. آدم

  • Published online:

حاول العلماء بناء دوائر إلكترونية على مدى عقود، مستوحاة من الشبكات العصبية الدماغية، يمكنها معالجة كميات كبيرة من البيانات. ومع ذلك.. كان من الصعب تحقيق كفاءة في استهلاك الطاقة عند تنفيذ عصبونات ومشابك عصبية (وصلات بين العصبونات) اصطناعية. وفي بحث نُشر مؤخرًا في دورية Nature، أعلن أمبروجيو وزملاؤه1 عن شبكة عصبية اصطناعية تحتوي على أكثر من 200 ألف مِشْبَك عصبي، بوسعها تصنيف مجموعات معقدة من الصور. وقد أثبت عمل واضعي البحث أن الشبكات العصبية القائمة على المكونات المادية التي تستخدم أجهزة نانوية إلكترونية ناشئة يمكن أن تعمل على نحو مماثل للشبكات القائمة على البرمجيات المُشغلّة على أجهزة حواسيب عادية، مع استهلاك طاقة أقل بكثير.   

إنّ الشبكات العصبية الاصطناعية ليست مُبرمَجة بالطريقة نفسها المستخدَمة في أجهزة الحاسوب التقليدية. فمثلما يتعلم البشر بالتجربة، تكتسب هذه الشبكات وظائفها من البيانات التي تم الحصول عليها في أثناء عملية تدريب. ويتطلب تصنيف الصور، الذي تدخل به عمليات التعلم والذاكرة، آلاف المشابك العصبية الاصطناعية. وحالات هذه المشابك (خواصها الكهربية) تلزم برمجتها سريعًا، وبعدها يجب حفظ هذه الحالات لتشغيل الشبكة في المستقبل.

والأجهزة التشابكية النانوية - التي تتسم بمقاومة كهربية قابلة للبرمجة، مثل الأجهزة التي تستخدم تقنية ذاكرة تغيير الطور (PCM) - تبدو واعدة؛ بسبب حجمها المادي الصغير، وخصائص التخزين الممتازة التي تتمتع بها، إذ تحتوي الأجهزة التي تَستخدِم ذاكرة تغيير الطور على مادة تُعرف بزجاج الكالكوجينيد، الذي بإمكانه أن يتبدل على نحو يمكن عكسه بين طور غير متبلور (مقاومته عالية)، وطور متبلور (مقاومته منخفضة). ويُبرمَج طور المقاومة بالجهاز من خلال بلوَرَة جزء من المادة باستخدام حرارة موضعية ناتجة من التعرض لجهد كهربي. ويبقى هذا الطور لفترة طويلة بعد إزالة الجهد الكهربي، كما يمكن إجراء مزيد من البرمجة عن طريق بلوَرة أجزاء أخرى من المادة.

ولسوء الحظ... يمكن برمجة الأجهزة التي تستخدم ذاكرة تغيير الطور (PCM) في اتجاه واحد فقط: من مقاومة مرتفعة إلى مقاومة منخفضة، عن طريق الانتقال من بلورة منخفضة إلى بلورة مرتفعة. ولتحقيق حالة المقاومة المطلوبة بدقة جيدة، يتطلب ذلك سلاسل مكونة من مئات نبضات الجهد الكهربي. وإذا تم تجاوز الحالة المطلوبة، تنبغي إعادة ضبط زجاج الكالكوجينيد بالكامل إلى حالته غير المتبلورة، وإعادة بدء البرمجة خطوة بخطوة من جديد. إنّ هذا القصور، بالإضافة إلى الاختلافات التي تنتج عن عملية التصنيع بين الأجهزة، قد يُبطئان تدريب الشبكة، أو يمنعانه، مثلما أوضح عملٌ سابق للفريق الذي أجرى الدراسة الحالية2 ونتيجة لذلك.. فإن النماذج الأولية للشبكات التي تم إنشاؤها باستخدام تلك الأجهزة3،4 ليست عملية، وتتسم بدقة منخفضة في تصنيف الصور، أكثر بكثير من الشبكات القائمة على البرمجيات.  

يكمن الإنجاز الذي حققه أمبروجيو وزملاؤه في منهجية مستوحاة من الطبيعة، مكونة من شقين. في الشبكات العصبية الحيوية، تدعم التغييراتُ قصيرة المدى التي تطرأ على حالة المشابك العصبية مجموعةً متنوعة من العمليات الحسابية، بينما توفر التغييرات طويلة المدى منصة للتعلم والذاكرة5. ولهذا السبب.. تَستخدِم الشبكة العصبية الاصطناعية الخاصة بالباحثين "خلايا" تشابكية تحتوي على نوعين من المشابك: مشابك قصيرة المدى، ومشابك طويلة المدى (شكل 1).

شكل 1| شبكة عصبية اصطناعية تتألف من نوعين من المشابك العصبية. يعلن أمبروجيو وزملاؤه1 عن شبكة عصبية اصطناعية قائمة على مكونات مادية، تم تدريبها على تصنيف صور معقدة، مثل الأرقام المكتوبة بخط اليد، بدقة مماثلة للشبكات القائمة على البرمجيات. وتتألف الشبكة من عصبونات اصطناعية متصلة، عن طريق أسلاك بنوعين من المشابك العصبية الاصطناعية (وهى الوصلات بين العصبونات). وتُستخدم المشابك قصيرة المدى (التي تستطيع الاحتفاظ بالتغيير في حالتها التشابكية لمدة عدة أجزاء من الألْف من الثانية) بانتظام في أثناء تدريب الشبكة، بينما تُستخدم المشابك طويلة المدى (التي تحتفظ بالحالة التشابكية لمدة تصل إلى سنوات) بشكل أساسي في مهام الذاكرة. إنّ المشابك طويلة المدى هى أجهزة مادية، بينما العصبونات والمشابك قصيرة المدى تتم محاكاتها حوسبيًّا (المناطق المُوضَّحة بالتظليل).

شكل 1| شبكة عصبية اصطناعية تتألف من نوعين من المشابك العصبية. يعلن أمبروجيو وزملاؤه1 عن شبكة عصبية اصطناعية قائمة على مكونات مادية، تم تدريبها على تصنيف صور معقدة، مثل الأرقام المكتوبة بخط اليد، بدقة مماثلة للشبكات القائمة على البرمجيات. وتتألف الشبكة من عصبونات اصطناعية متصلة، عن طريق أسلاك بنوعين من المشابك العصبية الاصطناعية (وهى الوصلات بين العصبونات). وتُستخدم المشابك قصيرة المدى (التي تستطيع الاحتفاظ بالتغيير في حالتها التشابكية لمدة عدة أجزاء من الألْف من الثانية) بانتظام في أثناء تدريب الشبكة، بينما تُستخدم المشابك طويلة المدى (التي تحتفظ بالحالة التشابكية لمدة تصل إلى سنوات) بشكل أساسي في مهام الذاكرة. إنّ المشابك طويلة المدى هى أجهزة مادية، بينما العصبونات والمشابك قصيرة المدى تتم محاكاتها حوسبيًّا (المناطق المُوضَّحة بالتظليل). 

كبر الصورة

تُستخدَم المشابك قصيرة المدى بانتظام في أثناء تدريب الشبكة، ويجب الاحتفاظ بحالتها لفترة قصيرة فقط، وإنْ كانت تحتاج إلى برمجة سريعة ودقيقة للحالة المرغوبة. ويتحقق ذلك من خلال مفتاح إلكتروني يُسمَّى الترانزيستور، الذي يتمتع بمكثف (جهاز لتخزين الشحنات الكهربية) مُلحَق بأحد أقطابه المعروفة بالبوابة6. وتتم برمجة حالة الترانزيستور من خلال تعرُّض البوابة لنبضة جهد كهربي سريعة. ويحافظ المُكثِّف على هذا الجهد الكهربي لبضعة أجزاء من الألف من الثانية، موفرًا بذلك آلية للاحتفاظ بحالة المِشْبَك لفترة وجيزة.

وبعد أن يتم تدريب الشبكة على عدة آلاف من الصور، وبعد تغيير حالة المشابك قصيرة المدى بصورة ملحوظة، تتم كتابة الحالات التشابكية في المشابك طويلة المدى، ثم يتم تكرار الدورة إلى أن ينتهي تقديم كل الصور التدريبية إلى الشبكة. وتُستخدم المشابك طويلة المدى لتشغيل الشبكة بعد اكتمال التدريب، حيث تتألف من أجهزة تَستخدِم ذاكرة تغيير الطور (PCM)، تصل مدة الاحتفاظ بالحالة لديها إلى سنوات، وذلك على حساب برمجة شاقة وشديدة الاستهلاك للطاقة.

تمتاز تلك التقنية بأنّ نَقْل الحالة من المشابك قصيرة المدى إلى المشابك طويلة المدى يمكن إجراؤه في وحدات دوائر إلكترونية منفصلة عن الشبكة، بينما تقوم الشبكة بأداء مهام أخرى. وإضافة إلى ذلك.. بالرغم من أن الخلايا التشابكية الخاصة بالباحثين تُعَد أكثر تعقيدًا من الناحية العملية، إذ تحتوى على مكثف واحد، وجهازين يَستخدِمان ذاكرة تغيير الطور (PCM)، وخمسة ترانزيستورات، فلا يزال حجمها أقل بمقدار النصف من حجم المشابك العصبية الاصطناعية المستخدَمة في الشبكات الأخرى6.

وقد قام أمبروجيو وزملاؤه باختبار منهجية الخلايا التشابكية باستخدام شبكة عصبية اصطناعية معقدة إلى حد ما، تحتوي على طبقات عديدة من العصبونات، وما يزيد على 200 ألف من الأجهزة التي تستخدم ذاكرة تغيير الطور (PCM). وأجرى الباحثون مهام تصنيف باستخدام ثلاث مجموعات قياسية من الصور: أرقام مكتوبة بخط اليد بتدرج رمادي، مأخوذة من قاعدة البيانات المعدلة للمعهد الوطني للمعايير والنكتولوجيا MNIST)7)، وصور ملونة من قاعدتي بيانات المعهد الكندي للبحوث المتقدمة CIFAR-10  وCIFAR-100 (المرجع رقم 8). وكانت الدقة التي تم الحصول عليها بنسبة: 98%، و88%، و68% على الترتيب. وتشبه تلك النتائج - إلى حد مذهل - ما تم الحصول عليه باستخدام برنامج TensorFlow، وهو برنامج رائد في مجال الشبكات العصبية (انظر: www.tensorflow.org).

وعلى الرغم من تلك النتائج المثيرة للإعجاب، يكمن وجه القصور الرئيس لهذا العمل في أن الأجهزة التي تَستخدِم ذاكرة تغيير الطور (PCM) هى فقط ما تم تصنيعه في الواقع، أما المكونات الأخرى للخلايا التشابكية والعصبونات، فقد تمت محاكاتها باستخدام الحاسوب. وراعَى المؤلفون استخدام نماذج دقيقة تضع في الحسبان الاختلافات بين الترانزيستورات، واقترحوا طريقة لتقليل تأثير هذا الاختلاف في أداء الخلايا التشابكية. والأهم من ذلك.. أنهم قاموا بإجراء تقييم مفصَّل للطاقة، ووجدوا أن تقنيتهم المقترَحة من شأنها أن تستهلك طاقة أقل بحوالي 100 مرة من الشبكات الحالية المتطورة، بينما تحقِّق أداء تصنيفيًّا مماثلًا. ومع ذلك.. فإن النماذج الأولية المادية الفعّالة وحدها هي القادرة على إقناع الصناعة بأداء تلك التقنية ومزاياها في استهلاك أقل للطاقة. وإضافة إلى ذلك.. لا يزال استهلاك الطاقة المُقَدَّر شديد البعد عما تستهلكه الشبكات العصبية الحيوية، وهو ما يترك مساحة كبيرة للتطوير.

ومع ذلك.. فإن عمل أمبروجيو وزملائه ليس مجرد خطوة مهمة في الطريق إلى إدماج الأجهزة التي تستخدم ذاكرة تغيير الطور (PCM) في المكونات المادية الخاصة بالشبكات العصبية. فهو يُلهِم أيضًا الأبحاث حول الأجهزة، لأنه يخلق الحاجة إلى مشابك عصبية نانوية قصيرة المدى، كي تحلّ محل المشابك الكبيرة المتألفة من الترانزيستورات والمُكثفات. لقد تم فتح آفاق في مجال تقنيات الذاكرة الناشئة؛ فالشبكات القائمة على تلك الأجهزة يمكن أن تضاهي مستوى نظائرها البرمجية. وتشير تلك النتائج إلى أن التطور في الذكاء الاصطناعي لن يستمر فقط، ولكنه سيتسارع أيضًا، عن طريق المكونات المادية الجديدة.   

References

  1. Ambrogio, S. et al. Nature 558, 60–67 (2018). | article
  2. Burr, G. W. et al. 2014 IEEE Int. Electron DevicesMeet. 29.5.1–29.5.4 (IEEE, 2014).
  3. Gokmen, T. & Vlasov, Y. Front. Neurosci. 10, 333 (2016). | article
  4. Yu. S. et al. 2015 IEEE Int. Electron Devices Meet. 17.3.1–17.3.4 (IEEE, 2015).
  5. Abbott, L. F. & Regehr, W. G. Nature 431, 796–803 (2004). | article
  6. Kim. S., Gokmen, T., Lee, H.-M. & Haensch, W. E. 2017 IEEE 60th Int. Midwest Symp. Circuits Systems 422–425 (IEEE, 2017). 
  7. Lecun, Y., Bottou, L., Bengio, Y. & Haffner, P. Proc. IEEE 86, 2278–2324 (1998). | article
  8. Krizhevsky, A. Learning Multiple Layers of Features From Tiny Images Ch. 3; https://www.cs.toronto.edu/~kriz/learning-features-2009-TR.pdfhttps://www.cs.toronto.edu/~kriz/cifar.html (2009). | article

جينا سي. آدم من معهد الأبحاث والتطورات في حقل المايكروتكنولوجي، بوخارست 077190، رومانيا.

البريد الإلكتروني: gina.adam@imt.ro