تكنولوجيا

حاوياتٌ سحابية

تسمح هذه المنصات المعيارية للباحثين بتشغيل برمجيات بعضهم بعضًا، دون الحاجة إلى تثبيت أي برامج.

جيفري إم. بيركل

  • Published online:

Illustration by The Project Twins

تقضي نسخة العصر الرقمي من قانون مورفي بأنَّه "إذا كان يُمكن لأي شيءٍ أن يفشل، فسوف يفشل أثناء عرضه مباشرةً أمام جمهور". وقد حدث هذا مع بن مارويك أمام قاعةٍ مليئة بطلاب علم الآثار الطبيعية في برلين. وكان الموضوع الذي يتناوله هو القابلية الحوسبية لتكرار النتائج باستخدام أداة «دوكر» Docker.

وأداة «دوكر» هي أداة برمجة، تنشئ ما يُعرف بـ«الحاويات»، وهي بيئاتٌ حوسبية معيارية، يمكن مشاركتها، وإعادة استخدامها. وتضمن هذه الحاويات أن تُشغَّل عمليات التحليل الحوسبية دائمًا باستخدام البِنْية التحتية الأساسية نفسها، وهو ما يعزز قابلية تكرار النتائج. ومن ثم، تُجنِّب أداة «دوكر» الباحثين صعوبات تثبيت برامج الأبحاث وتحديثها، بيد أن استخدام تلك الأداة قد يكون صعبًا.

وكان مارويك - عالِم الآثار في جامعة واشنطن بمدينة سياتل الأمريكية - قد أصبح بارعًا في نقل ملفات ضبط إعدادات أداة «دوكر» - المعروفة باسم «Dockerfiles»- من مشروعٍ إلى آخر، بإدخال بعض التعديلات البسيطة على هذه الملفات؛ لتصبح جاهزةً للعمل. ومن هنا، دعاه زملاؤه في ألمانيا لتعليم طلابهم كيفية فِعْل ذلك. ونظرًا إلى أنَّ كل طالب استخدم مجموعة مختلفة قليلًا من المكونات المادية والبرامج المثبتة على حاسوبه، احتاج كل واحدٍ منهم إلى ضبط الأداة حسب متطلبات تلك المكونات المادية والبرامج. ولهذا.. كان العرض التوضيحي "كارثةً تامة" حسب ما قاله مارويك.

وحاليًّا، توجد مجموعةٌ متزايدة من الخدمات التي تسمح للباحثين بتجنب مثل هذه الفوضى. وبتوظيف هذه الخدمات - التي تشمل «بايندر» Binder، و«كود أوشن» CodeOcean، و«كولابوراتوري» Colaboratory، و«جيجانتوم» Gigantum، و«نِكست جورنال» Nextjournal - يمكن للباحثين تشغيل كودٍ على سحابة الإنترنت، دون الحاجة إلى تثبيت المزيد من البرامج. ويمكنهم أن يحددوا إعدادات برامجهم، وينقلوا هذه البيئات الحوسبية من حواسبهم المحمولة إلى عناقيد حوسبة عالية الكفاءة، ثم مشاركتها مع زملائهم. ومن خلالها أيضًا يستطيع المعلمون وَضْع مواد مُقَرّرٍ دراسي، ومشاركتها مع الطلاب، ويمكن للدوريات أن تحسِّن قابلية تكرار نتائج الأبحاث المنشورة. وبهذا.. أصبح من الأسهل - أكثر من أي وقت مضى - فهْم الطرق الحوسبية التي يَعتمِد عليها العِلْم الحديث، وتقييمها، واستخدامها، وإدخال التعديلات عليها.

وعلى سبيل المثال.. قضى ويليام كون - الباحث في مجال دراسات النوم بكلية الطب في جامعة هارفارد، الموجودة بمدينة بوسطن في ولاية ماساتشوستس الأمريكية - أسابيع في كتابة خوارزمية وتصحيح أخطائها، ليكتشف بعدها أنَّ كودًا وضعه أحد زملائه في واحدةٍ من تلك الحاويات كان يمكن أن يوفر عليه الكثير من الوقت، وقد علَّق كون على هذا قائلًا: "كان بإمكاني أن أبدأ العمل مباشرةً، مستفيدًا من كل جهود تصحيح الأخطاء التي قام بها بالفعل، بمجرد ضغطة زر".

وتتطلب البرامج ذات التطبيقات العلمية تثبيت شبكةٍ معقدة للغاية من "المتطلبات" الحوسبية (مكتبات الأكواد والأدوات التي تعتمد عليها كل وحدة في البرنامج للعمل). كما تقتضي التعامل مع تلك الشبكة واستكشاف مشكلاتها، وإصلاحها. وبعض هذه المتطلبات يجب تحويله من كوده المصدري إلى كودٍ جاهز للعمل، أو ضبطه بإعداداتٍ معينة، وقد تتحول عملية تثبيت هذه المتطلبات - التي يُفترض أن تستغرق بضع دقائق - إلى رحلةٍ طويلة محبِطة على الإنترنت، تتنقل فيها بين المواقع الإلكترونية، مثل «ستاك أوفرفلو» Stack Overflow، و«جيت هاب» GitHub. وعن تلك المصاعب.. تقول كيرستي ويتيكر، عالمة الأعصاب بمعهد آلان تيورنج في لندن: "إحدى أصعب مراحل عملية تكرار النتائج هي إعداد حاسوبك بالطريقة ذاتها التي أُعد بها حاسوب شخصٍ آخر. إنّ هذا صعب للغاية".

تقييمٌ أسهل 

تختصر أداة «دوكر» تلك العملية إلى أمرٍ واحد. وعن هذا تقول لورينا باربا، مهندسة الميكانيكا والطيران بجامعة جورج واشنطن في العاصمة الأمريكية واشنطن: "تقلل أداة دوكر حقًّا المعوقات التي تواجهها خلال تلك المرحلة من عملية تكرار عمل شخصٍ آخر، والتي يتعين عليك خلالها تجهيز البرنامج من كوده المصدري، ودمجه مع المكتبات الخارجية الأخرى. فهي تسهل هذه المرحلة، وتجعلها أقل عرضة للخطأ، وبالتالي تتطلب جهدًا ووقتًا أقل من الباحثين".

وينفِّذ فريق باربا معظم أعماله من خلال حاويات «دوكر»، لكنَّه فريق يتألف من مجموعة بحثية بارعة من الناحية الحوسبية، وربما تجد المجموعات البحثية الأخرى تلك العملية شاقة. فنظرًا إلى أنَّ أداة «دوكر» هي تطبيق مُشغَّل بسطور الأوامر النصية، تحتوي الأداة على العشرات من الخيارات، وإنشاء ملف من ملفاتها دون أخطاء قد يصبح عمليةً محبطة.

وهنا يأتي دور الخدمات المعتمدة على سحابة الإنترنت.. فخدمة «بايندر» مثلًا هي مشروع مفتوح المصدر، يسمح للمستخدمين بتجربة الدفاتر الحوسبية، مثل دفاتر برنامج «جوبيتر» Jupyter، أو الدفاتر المحفوظة بصيغة «آر مارك داون» R Markdown، التي تمزج الأكواد والأشكال والنصوص معًا. أما خدمة «كولابوراتوري» المجانية، وخدمات «كود أوشن»، و«جيجانتوم»، و«نِكست جورنال»، التي تتضمن ميزاتٍ مجانية وأخرى مدفوعة، فكلها تسمح للمستخدمين كذلك بكتابة الأكواد في السحابة، وفي بعض الحالات تتيح أيضًا إرفاق البيانات المقرر معالجتها معها. وتسمح هذه المنصات أيضًا للمستخدمين بتعديل الكود، واستخدامه لمعالجة مجموعات بيانات أخرى، وتوفر خصائص للتحكم في نسخ البرامج؛ بغرض مراجعة التغييرات.

وتسهِّل مثل هذه الأدوات على الباحثين تقييم أعمال زملائهم. وعن هذا يقول كارتِك رام، المتخصص في علم التحليل الحوسبي للنظم البيئية بجامعة كاليفورنيا في مدينة بيركلي الأمريكية: "باستخدام »بايندر«، يتخلص المرء من عائق تثبيت البرامج". ويتابع كلامه قائلًا: "إذا أمكنني النقر فوق زر، لأجد نفسي في دفترٍ حوسبي مُثبَّت فيه كل الأدوات، وبيئته الحوسبية كما أردتها أنت بالضبط، فبهذا تكون قد سهَّلت عليّ مراجعة عملك وتقييمه".

ويختلف تحديد المتطلبات الحوسبية اللازمة ومكان العثور عليها من منصةٍ إلى أخرى. ففي منصتَيْ «كود أوشن»، و«جيجانتوم»، لا تتطلب العملية سوى الإشارة بمؤشر الفأرة، ونقر زرٍّ ما، بينما تتطلب منصة «بايندر» قائمةً من المتطلبات الحوسبية الموجودة في مستودعٍ بموقع «جيت هاب». لذا.. تنصح ويتيكر بتكويد البيئة الحوسبية مبكرًا قدر الإمكان في المشروع، ثم الالتزام بها. وتقول عن ذلك: "إذا حاولتَ فعل ذلك في النهاية، فكأنَّك تُنقِّب عن كودك، وهذا صعب حقًّا". وقد طوَّر رام أداةً، تُسمَّى «هول بنش» Holepunch، للمشروعات التي تستخدم لغة «آر» للبرمجة الإحصائية. وتختزل هذه الأداة عملية إعداد منصة «بايندر» إلى أربعة أوامر غير معقدة. (طالِعْ أمثلةً من الكود الخاص بدورية Nature وهو يعمل على المنصات الخمس على الرابط التالي: go.nature.com/2ps9se1).

وأسهل طريقة لتجربة منصة «بايندر» هي موقع mybinder.org، وهو موقع مجاني، لكنَّه محدود من الناحية الحوسبية. ولمزيدٍ من الفاعلية والأمان، يمكن للباحثين - بدلًا من ذلك - تصميم بيئاتٍ حوسبية خاصة حسب الحاجة، من خلال تكنولوجيا «بايندر هاب» BinderHub. ولدى معهد آلان تيورنج اثنان من هذه البيئات الحوسبية، إحداهما تُسمَّى «هاب 23» Hub23 (في إشارةٍ إلى المبنى رقم 23 في منشأة فك الشفرات بمتنزّه بليتشلي في المملكة المتحدة أثناء الحرب العالمية الثانية، الذي كان يُسمَّى Hut 23)، وهي بيئة حوسبية توفر موارد أكبر، وتتيح إمكانية العمل على مجموعات بيانات لا يمكن مشاركتها علانيةً، حسبما أوضحت ويتيكر. ويقول جو هامان - المتخصص في علم التحليل الحوسبي للتغيرات الهيدرولوجية الناجمة عن المناخ في المركز الوطني لأبحاث الغلاف الجوي بمدينة بولدر في ولاية كولورادو الأمريكية - إنَّ مجتمع «بان جيو» Pangeo - الذي يروج لتطوير برامج مفتوحة المصدر لأبحاث علوم الأرض تتسم بقابلية تكرار نتائجها، وإمكانية استخدامها في أنظمةٍ مختلفة - قد صمَّم بيئةً حوسبية خاصة من خلال تكنولوجيا «بايندر هاب»؛ حتى يتمكن الباحثون من استكشاف مجموعات بيانات الأقمار الصناعية والنماذج المناخية، التي قد يصل حجمها إلى عشرات التيرا بايت. (نشر فريق ويتيكر دليلًا لكيفية تصميم البيئات الحوسبية الخاصة باستخدام تكنولوجيا «بايندر هاب» على الرابط التالي: go.nature.com/349jscv).

اللغات، وسُحُب البرمجيات

منصة «كولابوراتوري» التي طوّرتها شركة «جوجل» Google هي في الأساس مزيجٌ بين دفاتر برنامج «جوبيتر»، وخدمة «جوجل دوكس» Google Docs، وهو ما يعني أنَّ المستخدمين يمكنهم مشاركة الدفاتر المخزَّنة على خدمة «جوجل درايف» Google Drive، والتعليق عليها، وتعديلها بالتزامن مع بعضهم بعضًا. ويشغل المستخدمون أكوادهم في نظام التشغيل السحابي الذي توفره جوجل (لغة بايثون هي اللغة الوحيدة المدعومة رسميًّا على النظام)، باستخدام وحدة معالجة مركزية معيارية (CPU)، أو وحدة معالجة رسوم (GPU)، أو وحدة معالجة تِنسور (TPU)، وهي رقاقة متخصصة، مصمَّمة لبرنامج جوجل للتعلم العميق «تنسور فلو» TensorFlow. ويقول جايك فاندربلاس، عضو فريق منصة «كولابوراتوري» بشركة «جوجل» في مدينة سياتل الأمريكية: "يمكنك فتح دفترك، أو دفتر شخص آخر من موقع «جيت هاب»، وتُدخِل عليه بعض التعديلات، ثم تحفظ نسختك على خدمة «جوجل درايف»، ثم تعمل عليها لاحقًا".

وتدعم منصة «نِكست جورنال» الدفاتر المكتوبة بلغات «بايثون»، و«آر»، و«جوليا» Julia، و«باش» Bash، و«كلوجور» Clojure. وهناك لغاتٌ أخرى، جارٍ تطوير دعمها. ووفقًا لما قاله مارتن كافالار، المدير التنفيذي لشركة «نِكست جورنال»، التي يقع مقرها في برلين، فقد سجل ما يقرب من 3 آلاف مستخدِم اشتراكهم لدى الشركة، منذ أن أطلقت منصّتها في الثامن من شهر مايو الماضي.

أما منصة «جيجانتوم»، التي صدرت منها نسخةٌ تجريبية في العام الماضي، فتُوَفِّر برنامجًا (عميلًا) يعمل باستخدام متصفح الإنترنت، ويمكن للمستخدِمين تثبيته على أنظمتهم الخاصة، أو عن بُعد، لكتابة الأكواد في السحابة، وتشغيلها على بيئات تكويد أداتَي «جوبيتر»، و«آر ستوديو» R Studio. ويقول كون، الذي يستخدم منصة «جيجانتوم» لتشغيل خوارزميات تعلُّم الآلة في سحابة شركة «أمازون» Amazon، إنَّ هذه الخدمة تُسهِّل على المتعاونين معه بدء العمل سريعًا. وأوضح قائلًا: "يمكنهم تصفُّح دفاتر «جيجانتوم» الخاصة بي، واستخدام هذه البِنْية التحتية الحوسبية السحابية لتنفيذ مهام التدريب والتعلم".

وهناك أيضًا منصة «كود أوشن»، التي تدعم كلًّا من الدفاتر الحوسبية، والبرامج النصية التقليدية المكتوبة بلغات «بايثون»، و«آر»، و«جوليا» Julia، و«ماتلاب» Matlab، و«سي»C ، وغيرها. وحاليًّا، تَستخدِم دوريات عديدة تلك المنصة في مراجعة الباحثين الأقران للأوراق البحثية، وفي تعزيز القابلية الحوسبية لتكرار نتائجها، بما في ذلك دورياتٌ تابعة لشركة «تايلور أند فرانسيس» Taylor & Francis، و«دي جرويتر» De Gruyter، و«إس بي آي إي» SPIE. ومن الجدير بالذكر، أنه في عام 2018، أَطْلَقَت دوريات «نيتشر بيوتكنولوجي» Nature Biotechnology، و«نيتشر ماشين إنتيليجنس» Nature Machine Intelligence، و«نيتشر ميثودز» Nature Methods برنامجًا تجريبيًّا لاستخدام منصة «كود أوشن» في مراجعة الباحثين الأقران للأوراق البحثية، وانضمت إلى هذه التجربة لاحقًا دوريات Nature، و«نيتشر بروتوكولز» Nature Protocols، و«بي إم سي بيو إنفورماتيكس» BMC Bioinformatics. ووفقًا لإريكا باسترانا، مديرة تحرير دوريات العلوم التطبيقية والكيمياء الخاصة بشركة «نيتشر ريسرش» Nature Research، فقد تضمنت التجربة حتى الآن أكثر من 95 ورقة بحثية، ونُشِرَ أكثر من 20 ورقة منها.

وقد شاركت فيليسيتي ألين - المتخصصة في علوم الحاسوب بمعهد ويلكوم سانجر في مدينة هينكستون بالمملكة المتحدة - في تأليف دراسةٍ واحدة في هذه التجربة، كانت تحلل أنواع الطفرات التي يمكن أن تنشأ عن تعديل الجينات باستخدام أداة «كريسبر»، (انظر: F.Allen et al. Nature Biotechnol. 37, 64-72; 2019). وحسب تقديرها.. استغرق تجهيز البيئة الحوسبية على منصة «كود أوشن» للعمل أسبوعًا. وتقول عن ذلك: "بدا أنَّ المراجعين قد أُعجبوا حقًّا بها". وتضيف قائلة: "أعتقد أنَّه من الجيد أنَّها ضربت مثالًا على إمكانية أنْ يعمل أي نظامٍ عليها بمجرد ضغطة زر".

ورغم أن البعض يشعر بالقلق حيال فاعلية خدمات الحاويات الحوسبية التجارية هذه على المدى الطويل، فهي تتيح للباحثين خيارات بالفعل، إذ يشير سيمون أدار - المدير التنفيذي لشركة «كود أوشن» - إلى أنَّ "كبسولات الحوسبة" الخاصة بمنصة الشركة يحفظها في أرشيف مشروع «كلوكس» CLOCKS، الذي يحتفظ بنُسَخٍ رقمية من الأوراق العلمية المنشورة على الإنترنت. هذا.. بالإضافة إلى أنَّ منصات «كود أوشن»، و«جيجانتوم»، و«نِكست جورنال» تسمح بتصدير ملفات «دوكر»؛ لاستخدامها على منصاتٍ أخرى. وكل هذا يعني أنَّه يمكن للباحثين الوثوق في أنَّ أكوادهم ستظل صالحة للاستخدام، أيًّا كانت المنصة التي سيختارونها.

ومثال على ذلك.. بنجامين هايب كاينز،الباحث في علم الصيدلة الجينومي الحوسبي بمركز الأميرة مارجريت للسرطان في مدينة تورنتو بكندا، الذي استخدم منصة «كود أوشن» ليَرُدّ بسرعةٍ على انتقاداتٍ استهدفت تحليلًا نشره في دورية(NatureB. Haibe-Kains et al. Nature 504,389-393; 2013). فهو يرى أن المنصة ستؤمِّن له وسيلةً لضمان إمكانية استخدام كوده وتقييمه بواسطة فريقه، وبواسطة الباحثين الأقران المراجعين، والمجتمع العلمي كله. وقال عن ذلك: "إنّ المسألة لا تتعلق بحتمية صحة تحليل ما، أو عدمها، فلا شيء صحيح تمامًا في هذا العالَم، لكنْ إذا كنتَ تتوخى الشفافية الشديدة في عملك، فسيمكنك دائمًا التواصل بكفاءة في مواجهة النقد، لأنَّه ليس لديك ما تخفيه، فكل بياناتك متاحة".

جيفري إم. بيركل محرر للموضوعات المتعلقة بالتكنولوجيا في دورية Nature.