صندوق الأدوات

مستقبل رسوم البيانات العلمية

أدوات جديدة لإنتاج أشكال وبرمجيات تفاعلية، من شأنها أن تسهِّل الوصول إلى البيانات العلمية، وإمكانية تكرارها.

جيفري إم. بيركل
  • Published online:

Illustration by the Project Twins

مع بدء بنيامين ديلوري ورقته البحثية بتوثيق طريقة جديدة لقياس مورفولوجيا النبات، أدرك أن أحد الرسوم في البحث قد يسبّب مشكلة. يطرح البحث "شفرة تعريفية للاستمرارية"؛ لوصف الهيكل المتفرع الخاص بأنظمة جذور النباتات1، وكانت الصعوبة تكمن في كيفية توضيح ذلك بالصور.

يقول ديلوري - الباحث في مرحلة ما بعد الدكتوراة بـجامعة ليوفانا في لونبورج بألمانيا - إن الخوارزمية الخاصة بالشفرة التعريفية تلك "تتسم بالاستمرار والديناميكية". ويضيف قائلًا: "أفضل طريقة لتمثيل شيء ديناميكي هي إظهاره بصورة متحركة".

عادةً ما تُقدَّم الرسوم البيانية العلمية على هيئة صور ثابتة، إلا أنها تكون بمعزل عن البيانات الأساسية التي تمثلها، ما يحرم القراء من استكشافها بمزيد من التفصيل، عن طريق – مثلًا - تقريب الصورة للنظر بإمعان في ما يهمّهم. وبالنسبة إلى علماء الجينوم، الذين يحتاجون إلى تكريس الملايين من نقاط البيانات في رسوم مكثفة، لا يتعدى حجمها بضع سنتيمترات، فإن ذلك قد يمثل مشكلة.

وينطبق الأمر ذاته على الباحثين الذين يتعاملون مع الخوارزميات الحاسوبية. ينشر العلماء - في كثير من الأحيان - البرمجيات على مستودعات مفتوحة المصدر، مثل موقع "جيت هاب" GitHub، غير أن الحصول على الكود المطلوب للتشغيل الصحيح ليس سهلًا، بعكس ما يبدو. ففي الغالب، يحتاج المراجعون وغيرهم من الجهات المعنية برمجيات وإعدادات إضافية؛ لجعل الخوارزميات تعمل.

والآن، يعمل بعض الدوريات العلمية على سد هذه الفجوة، من خلال دعم الرسوم والأكواد التفاعلية. ومن هذه الدوريات "إف. وان ثاوزاند ريسيرش" F1000Research، التي عقدت مشارَكة في العام الماضي مع شركة «بلوتلي» Plotly للحوسبة في مونتريال في كندا، ومنصة "كود أوشن" Code Ocean في مدينة نيويورك. ونظرًا إلى هذه القدرات، إلى جانب إمكانية الوصول المفتوح التي تتيحها دورية F1000Research، أرسل ديلوري ومعاونوه بحثهم إليها؛ ونُشر البحث في شهر يناير الماضي1.

النشر التفاعلي

تنتشر الرسوم التفاعلية التي تتيح للقراء التعمق في البيانات الأساسية للموضوع على مواقع عدة، مثل موقع جريدة نيويورك تايمز وfivethirtyeight.com؛ إلا أنها أقل شيوعًا في مجال النشر العلمي.

يقول توماس إنجراهام - وهو محرر أول للنشر - إن "الرسوم الحية" في دورية F1000Research - وهي بمثابة مخططات تفاعلية، طُرحت لأول مرة في عام 2014، ويمكن تحديثها باستمرار ببيانات جديدة - قد تَطَلَّب إنتاجها مجهودًا كبيرًا، وهي غير قابلة للتطويع. أما شركة «بلوتلي»، فتسمح للمستخدمين إنشاء رسومهم ومشاركتها، بدءًا من المخططات النقطية، والرسوم البيانية الخطية، وانتهاء بالمخططات، والخرائط الكنتورية. وتتيح الصور الناتجة للمستخدمين تقريب الصورة للنظر في تفاصيل البيانات، وكذلك المرور عبر الصور، ومَسْحها، وتحريك الفأرة فوق النقاط؛ لرؤية القيم المُمثَّلة في الرسم. وتبدأ اشتراكات الطلاب بمبلغ 59 دولارًا أمريكيًّا في السنة، كما تتيح المكتبات مفتوحة المصدر للباحثين إنشاء رسوم «بلوتلي» تلك مجانًا باستخدام أكواد بلغات "آر" R، و"ماتلاب" MATLAB، و"بايثون" Python، و"جوليا" Julia.

أما منصة "كود أوشن"، فهي متاحة مجانًا للأكاديميين، لاستخدامها لمدة 10 ساعات حوسبة كل شهر، مع مساحة تخزين 50 جيجابايت؛ وتبدأ الباقات المدفوعة من 19 دولارًا في الشهر. تجمع المنصة الأكواد، والبيانات، والنتائج، والبيئة الحوسبية التي تُستخدم لإنشاء ذلك كله، في "كبسولة حاسوبية" مستقلة بذاتها، تمثل التكوين الحاسوبي الخاص بالمستخدم المعد. ويستطيع المستخدمون الآخرون تنزيل الكود، وتعديله، وتشغيله، إمّا من خلال موقع codeocean.com، أو عبر إحدى عناصر التحكم في واجهة المستخدم Widget (المعروفة بين المبرمجين باسم "الودجات")  الموجودة في الورقة البحثية.

وحتى هذه اللحظة، نشرت دورية F1000Research ست ورقات بحثية، تتضمن رسومًا بيانية حية من نوع "بلوتلي"، وخمس ورقات باستخدام عناصر تحكم تخص منصة "كود أوشن". وهي تعتزم في هذا العام إضافة دعم لخرائط تفاعلية توضح التفاعلات بين البروتينات وبعضها، التي يتم إنتاجها باستخدام أداة رسم الخرائط الشبكية "سايتوسكيب" Cytoscape. 

ويجب ألا يمتعض الباحثون من التعقيد المتصوَّر للأمر. فحسبما يقول عالِم الأحياء الحاسوبية شيجين جي – منجامعة ولاية ساوث داكوتا في بروكينجز - الذي أدرج رسومًا تفاعلية من نوع "بلوتلي" في إحدى أوراقه البحثية2، فإن إنشاء تلك الرسوم يتطلب سطرًا واحدًا إضافيًّا فقط من الأكواد لكل منها. وقد أنشأ توم ديكارلو - الباحث في علوم الشعاب المرجانية بمعهد المحيطات وكلية علوم الأرض في جامعة غرب أستراليا في كراولي، ستة مشروعات على منصة "كود أوشن" لعدة دوريات، منها دورية «باليوشينوجرافي آند باليوكليماتولوجي» Paleoceanography and Paleoclimatology، ودورية «بايوجيوساينسيز» Biogeosciences. ويقول: "رأيت أن ذلك له أهمية كبيرة في التواصل العلمي، وقابلية تكرار النتائج".

حلول مفتوحة المصدر

بالنسبة إلى الباحثين عن بدائل حاسوبية مفتوحة المصدر، يمكن لأداة تُعرف باسم "بايندر" Binder تحويل أي مستودع عام على موقع "جيت هاب" يحتوي على دفتر من نوع "جوبيتر" Jupyter (وهي مستندات تمزج النصوص والأكواد والبيانات)، أو كود بلغة "آر"، إلى حزمة يستطيع المستخدمون تشغيلها من المتصفح الخاص بهم. وكلّ ما يلزم المستخدِم أن يُدخِل عنوان مستودع الدفتر في شريط البحث على موقع mybinder.org؛ فيقوم البرنامج بإنشاء مساحة عمل تفاعلية قابلة للمشاركة. وتقول كارول ويلينج، وهي عضو في فريق مشروع "بايندر" بـجامعة ولاية كاليفورنيا للتقنيات المتعددة Cal Poly في سان لويس أوبيسبو: "إنها تساعد حقًّا على قابلية التكرار، وسهولة الاستخدام".

وتسهل هذه الأدوات أيضًا عملية مراجعة الأقران، كما يقول تيم هيد، وهو عضو في فريق مشروع "بايندر" في زيورخ بسويسرا. كان هيد قد شعر بالإحباط، إذ لم يستطع تشغيل البرنامج، عندما طُلبت منه مراجعة بحث بإحدى الدوريات. ويقول: "لو كانوا قد أرسلوا إليَّ رابطًا على "بايندر"؛ لكنتُ قد انتهيت منها الآن". 

كما أن هناك أيضًا خيارات أخرى مفتوحة المصدر، لإنشاء صور تفاعلية، ومنها "بوكه" Bokeh، وعناصر تحكم "إتش. تي. إم. إل." htmlwidgets، و"بايجيل" pygal، "وودجات آي. باي" ipywidgets. يُستخدم معظم هذه الخيارات برمجيًّا في العموم ضمن لغة "آر"، أو لغة "بايثون"، المستخدمتَين عادة في مجال العلوم. بإمكان المبرمجين – على سبيل المثال - استخدام عناصر تحكم "آي. باي"؛ لإسقاط المخططات التفاعلية ثلاثية الأبعاد، وكذا الخرائط والتصورات الجزيئية، في دفاتر "جوبيتر". كما أن هناك خيارًا آخر بلغة "جافا سكريبت" JavaScript، هو "فيجا لايت" Vega-Lite. ولأن هذه اللغة أقل انتشارًا في مجال العلوم، طَوَّر براين جرانجر بـجامعة ولاية كاليفورنيا للتقنيات المتعددة، وجيك فاندربلاس بـجامعة واشنطن في سياتل، واجهة بينية بلغة "بايثون"، اسمها "ألتير" Altair؛ لتسهيل الوصول إلى "فيجا لايت".

ورغم أن معظم هذه الأدوات يوفر دالّات لأنواع محددة من الرسوم البيانية، إلا أن "فيجا لايت" و"ألتير" هما بمثابة "قاعدتين" مرنتين، تصفان - على سبيل المثال - كيف تُرسم المتغيرات بسمات بصرية مختلفة، مثل اللون، أو الشكل. كما تتيحان الربط بين الرسوم البيانية وبعضها، حتى إنه عندما يحدد المستخدمون منطقة لرسم واحد، يجري تحديث شاشات الرسوم المجاورة تلقائيًّا. يقول جيفري هير، وهو متخصص في علوم الحاسب الآلي في جامعة واشنطن، وكان مختبره هو الذي طَوَّر "فيجا لايت": "هي في الواقع تتيح لنا استكشاف الروابط بشكل متعدد الأبعاد".

وهناك منتَجان آخران يسمحان للباحثين بإنشاء تطبيقات تفاعلية، تَستخدِم عناصر تحكم مثل القوائم المنسدلة، وعناصر التحكم المنزلقة؛ لإدماج البيانات، والرسوم، والأكواد، هما: "شايني" Shiny من تصميم "آر ستوديو" RStudio في بوسطن بولاية ماساتشوستس للغة "آر"، و"داش" Dash من تصميم شركة «بلوتلي» للغة "بايثون". وتعمل تلك المنتجات عن طريق نقل ما يقوم به المستخدِم بعناصر التحكم إلى خادم بعيد، يقوم بتشغيل الأكوادن ويحدِّث الصفحة.

قد تؤدي التطبيقات الناتجة إلى جعل البيانات والأدوات متاحة للباحثين الذين تزعجهم البرمجة. فعلى سبيل المثال، عمل طالب الدراسات العليا تال جاليلي مع زملائه بـجامعة تل أبيب على تطوير صندوق أدوات مبنِيّ على خدمات "بلوتلي"؛ لإنشاء خرائط حرارية تفاعلية من مجموعات البيانات المحمّلة، فضلًا عن واجهة بينية بتطبيق "شايني"، تشغِّل الأكواد من وراء الكواليس. كما قامت ماين سيتنكايا روندل - وهي خبيرة في الإحصاء بـجامعة ديوك في دورهام بولاية نورث كارولينا - بإنشاء موارد بتطبيق "شايني" للمساقات الدراسية الجامعية لمادة الإحصاء؛ لمساعدتها على توضيح المفاهيم الصعبة خلال المحاضرات.

وتقول سيتنكايا روندل: "إنه لمِن اللطيف أن نمسك بذلك، ونقول: حسنًا، الآن بعد أن قدمنا ​​هذا الشيء، ما الذي سيحدث عندما نتحرك بين عناصر التحكم المختلفة؟"

إنّ نَشْر هذه الجموع المدمجة على المواقع الإلكترونية للدوريات يتطلب إجراء تغييرات في أدوات الكتابة، وسير العمل التحريري فيها، وكذلك البنية التحتية. وقد ينطوي ذلك أيضًا على إسناد بيانات علمية إلى جهات خارجية، لا يمكنها ضمان استمراريتها على الدوام.

وللإسهام في التعامل مع الأمر، يهدف مشروع جمع المستندات القابلة للتكرار - الخاص بشركة النشر «إي لايف» eLife، التي تتبنى نهج الوصول المفتوح - إلى إنتاج مجموعة أدوات شاملة؛ من أجل كتابة مستندات تتسم بقابليتها للتكرار حاسوبيًّا، وتقديمها، ونشرها، كما يقول جوليانو ماكيوتشي، الذي يقود عمليات تطوير المنتجات في شركة «إي لايف». ويقول إن الخطة هي أن يتم تجميع العديد من "الروائع" العلمية الأساسية التي تتضمنها إحدى الأوراق البحثية – وتشمل نصوصها، ورسومها، وأكوادها، وبياناتها، وبيئتها الحوسبية - في كيان واحد يمكن تنزيله. وللتشجيع على ذلك، جعلت الدورية مجموعات المستندات تلك مفتوحة المصدر.

إحراز تَقَدُّم

والآن، تدعم عدة دوريات أخرى وناشرون فكرة الدمج بمنصة "كود أوشن"، ومن بينهم دورية «جيجا ساينس» Gigascience، وIEEE، وSPIE، ومطبعة جامعة كامبريدج، وشركة «تايلور آند فرانسيس» Taylor & Francis. ويتيح عارض البيانات "جيه. سي. بي. داتا فيووِر" JCB DataViewer الخاص بدورية «جورنال أوف سِل بيولوجي» Journal of Cell Biology، والمبنِيّ على برنامج "أوميرو" OMERO مفتوح المصدر، للقراء استكشاف الصور المجهرية الأصلية، بدلًا من الملفّات المعالَجة المضغوطة التي يرونها عادة. وتقدِّم أداة أخرى ذات صلة - وهي "إيمدج داتا ريسورس" Image Data Resource - وظيفة مماثلة للبحوث المنشورة في أي دورية. وقد نشرت دورية Nature أيضًا رسومًا تفاعلية، كما حدث - على سبيل المثال - في ورقة بحثية تصف مشروع "موسوعة عناصر الحمض النووي"3. ويقول أحد المتحدثين باسم الدورية إنها تدرس عدة خيارات أخرى للأكواد، والرسوم التفاعلية. وفي الوقت الحالي، وإلى أن يحدث ذلك، كثيرًا ما يدرِج الباحثون في مقالاتهم روابط لرسوم خارجية.

يقول إيريز ليبرمان إيدين من كلية بايلور للطب في هيوستن بولاية تكساس، الذي نشر خرائط تفاعلية توضح تفاعلات الكروماتين في بحث نُشر مؤخرًا بدورية "سِل" 4Cell، إنه مع إقبال دوريات أكثر على فكرة التفاعلية، فإن عرض المعلومات العلمية على شبكة الإنترنت قد يتغير تغيرًا جوهريًّا؛ الأمر الذي يعزز قابلية التكرار. فالرسوم الثابتة لا تعطي سوى وجهة نظر واحدة عن البيانات، ويقول: "إن القراء المطلعين يحتاجون إلى امتلاك القدرة على استخلاص استنتاجاتهم بأنفسهم. وينبغي أن يكون هناك فرق بين قراءة الأوراق البحثية في عام 1974، وقراءتها في 2017".

References

  1. Delory, B. M. et al. F1000Research 7, 22 (2018). | article

  2. Jung, D. & Ge, X. F1000Research 6, 1969 (2017). | article
  3. The ENCODE Project Consortium. Nature 489, 57–74 (2012). | article

  4. Rao, S. S. P. et al. Cell 171, 305–320 (2017). | article

جيفري إم. بيركل محرر التكنولوجيا في دورية Nature.