صندوق الأدوات

إتاحة المعلوماتية الحيوية

علماء الأحياء الحوسبية يشرعون في تطوير منصّات تتيح القدرة على تحليل بيانات التسلسل الجيني، وتفسيرها.

جيريمي إم. بيركل
  • Published online:

Illustration by the project twins

بالنسبة إلى الأطباء الذين يحاولون علاج المرضى الذين تظهر عليهم أعراض ليس لها سبب واضح، قد تساعد تقنيات التسلسل الجينيّ على إرشادهم إلى تشخيص مُحَدَّد، لكنّ الحجم الصخم للبيانات المستخلَصة قد يجعل من الصعوبة بمكان الوصول إلى إجابة سريعًا.

حتى عامَيْن فقط، كان أطباء وحدة البحوث الطبية للبحرية الأمريكية (نمرو-6) في مدينة ليما، عاصمة بيرو، يضطرون إلى إرسال بيانات التسلسل الجينيّ إلى الولايات المتحدة؛ لتحليلها، وهي العملية التي يمكن أن تستغرق أسابيع، وهي فترة طويلة جدًّا؛ من أجل اتخاذ قرارات علاجية عاجلة. تقول ماريانا ليجويا، التي ترأس وحدة الجينوم والكشف عن مسبِّبات الأمراض الملحَقة بالمركز: "إذا كان جُلّ ما في مقدورك هو الحصول على البيانات التي ينبغي عليك شحنها لاحقًا إلى الولايات المتحدة، فالأمر عديم الجدوي تقريبًا".

لم تَعُد ليجويا مضطرة إلى انتظار التحليلات، حيث أصبح باستطاعتها الحصول على النتائج في غضون أيام، بل وساعات، وتستطيع إجراءها في مختبرها الخاص. وتستغل وحدتها أداة EDGE (تمكين تطوير خبرة الجينوم)، وهي أداة معلوماتية بيولوجية تنطوي على مهام جرثومية- جينومية، كتجميع التسلسل الجيني، وتحديد الأنواع، من خلال واجهة رائعة تسمح للمستخدمين بتوليد تحليلات مُنَقَّحَة. تقول ليجويا: "يمكننا الحصول على معلومات فعّالة في موقع العمل، تسمح لنا باتخاذ قرارات سريعًا جدًّا بشأن كيفية المضي قدمًا".

وأداة EDGE ليست الأولى من نوعها التي تُبَسِّط المعلومات بواجهة تأشير ونقر، بل إنها تفتقر إلى الكثير من المرونة، ونطاق البدائل الأكثر رسوخًا، مثل منصة جالاكسي Galaxy، ومنصة بيس سبيس BaseSpace التابعة لشركة "إيلومينا"، غير أن بساطتها تستقطب المستخدمين إليها، ولولاها، لربما أداروا ظهورهم لنظم المعلومات البيولوجية. يقول كلينتون بادين، الذي يستعمل أداة EDGE في أبحاثه حول نشوء الأمراض الفيروسية في "المراكز الأمريكية لمكافحة الأمراض والوقاية منها" في أتلانتا بولاية جورجيا: "لقد استخدم أداة EDGE هؤلاء الذين لم يتكلفوا عناء تعلُّم أدوات سطر الأوامر". ومن هذا المنطلق، فهي تمثل دراسة حالة منفردة في إتاحة معلومات الجينوم، وهي الدراسة التي يمكن أن تُعَجِّل من تَبَنِّي علماء البيولوجيا البحتة لهذا المجال.

المعلوماتية في الميدان

يقول باتريك تشين، الذي قاد عملية تطوير البرنامج1 في مختبر لوس آلاموس الوطني (LANL) في ولاية نيو مكسيكو، إنّ أداة EDGE صُنِعَت لمحاولة مواكَبة الوفرة سريعة النمو لمُنَظِّمَات تتابع الحمض النووي DNA في ظل ندرة الخبرة الضرورية لتفسير البيانات. وهي مصممة لاستخدامها في المنشآت التي تفتقر إلى الخبرة في مجال المعلوماتية الحيوية، حسب قول جو أندرسون، عالِم البيولوجيا الحاسوبية، الذي نَقَّحَ البرنامج؛ ليواكب التطبيقات العسكرية في إدارة أبحاث الدفاع الحيوية (BDRD) في مركز الأبحاث الطبية البحرية بمدينة فريدريك في ولاية ميريلاند.

كما إنها أداة مفتوحة المصدر، ومستقلة، وتُقَدِّم تحليلات متكاملة لعلم الجينوم الميكروبيّ، بدايةً من قراءات المتواليات الخام، وانتهاءً بتحديد الأنواع وعِلم تطور السلالات بنقرة واحدة. وتشغيل النظام رخيص نسبيًّا أيضًا، حيث يمكن شراء مكونات المعدات الموصَى بها (ذاكرة بسعة 256 جيجابايت، ومعالجات بسعة 64 بت) بأقل من عشرة آلاف دولار أمريكي، حسب قول أندرسون. وهذا يعني أن أغلب المختبرات التي يمكنها تحمُّل تكلفة إقامة مشروعات ترتيب متتاليات الحمض النووي DNA يمكنها شراء المعدات. يقول أندرسون: "وهذا لا يُعتبر أموالاً مُهدَرة، لكنه رخيص بقدر كبير". ومن المفيد أيضًا أن نعلم أنّ الإعداد لا يعتمد على الاتصال بالإنترنت، ويمكن تشغيل الأداة بواسطة مُوَلِّد.

ويمكن للمستخدمين الذين يملكون وَصْلات إنترنت قوية تثبيت النظام على شبكة سحابية. ويشير نيكولاس لومان - أخصائي المعلوماتية الحيوية في جامعة برمنجهام بالمملكة المتحدة - إلى خدمة CLIMB، وهي البنية الأساسية السحابية للمعلوماتية الحيوية الميكروبية، التي ساعد في تطويرها. وCLIMB بمثابة خدمة مجانية، مخصصة تحديدًا للأكاديميين في المملكة المتحدة، الذين يعملون على علم الجينوم الميكروبيّ.

وقد دَعَّم "مجلس الأبحاث الطبية البريطاني" خدمة CLIMB بمبلغ 8.4 مليون جنيه إسترلينيّ (10.5 مليون دولار أمريكي). وتضم الخدمة عديدًا من أدوات المعلوماتية الحيوية، بما في ذلك قواعد بيانات لتسلسلات الـ DNA، ومنصة تحليل تُعرف باسم "مختبر علم الجينوم الافتراضيّ". يقول لومان: "إنني أفكر جديا في اقتناء EDGE كخيار محتمل إضافي أيضًا".

ويقول ثيرون هامِلتون - رئيس قسم علم الجينوم والمعلوماتية الحيوية في إدارة أبحاث الدفاع الحيوية - إنه تم تثبيت أداة EDGE إجمالاً في 18 مختبرًا تابعًا لوزارة الدفاع الأمريكية والدول الشريكة بشكل رسمي، وكذلك في كل القارات تقريبًا، فيما عدا قارة أنتاركتيكا.

وثمة واحدة من تلك النسخ المثبتة في العاصمة الكمبودية بنوم بنه في منشأة نمرو-2، وتستخدم النظام لتتبُّع أثر الأمراض المنقولة عن طريق ناقلات متعددة. يقول أندرسون: "ليس هذا هو المكان التقليدي الذي نقصده عادةً لإجراء عمليات المعلوماتية الحيوية"، لكن أداة EDGE تُغَيِّر هذه الأوضاع. ويضيف أندرسون: "ومن بين الأمور التي أدركتها أنك إذا أعطيت الباحثين أدوات، وتنحيت جانبًا؛ فسيذهلونك بما يحققوه".

تتضمن النسخة الأخيرة من أداة EDGE - النسخة 1.5 الصادرة في أكتوبر الماضي - 54 أداة لأطراف ثالثة. وجميع المكونات - بما في ذلك الخوارزميات، وقواعد البيانات، وأدوات المرئيات، والجينومات المرجعية - مُثَبَّتَة على خادم يقود ست وحدات تحليل متشابكة: تنقية المتواليات، والتجميع والحواشي، والمقارنة بالجينومات المرجعية؛ والتطابق التصنيفيّ؛ والتحليل التطوريّ؛ والتصميم الأوليّ لتفاعل البوليميراز المتسلسل. ومن المقرر تضمين وحدات إضافية، بما في ذلك وحدة لتحليل الحمض النووي الريبي RNA، ورصد مسببات الأمراض، وذلك في النسخة المقبلة EDGE 2.0، حسب تصريح تشين.

"لقد استخدم أداة EDGE هؤلاء الذين لم يتكلفوا عناء تعلُّم أدوات سطر الأوامر". 

في نوفمبر الماضي، استعرض تشين وزملاؤه قدرات EDGE في دراسة استخدموا فيها المنصة؛ لتجميع، وتصنيف، وتخطيط العلاقات التطورية لدى مُستفردات البكتيريا العصوية الجمرية Bacillus anthracis، واليرسينيا الطاعونية Yersinia pestis، وحل ميكروبيوم بشري زائف، وتحليل سلسلة من العينات الإكلينيكية البشرية، بما في ذلك حالات فيروس الإيبولا، وعدوى Escherichia coli1. وأول استعمال منشور لهذا النظام يرجع - في واقع الأمر - إلى ما قبل هذه الدراسة بعدة أشهر. فقد استعمل مختبر ليجويا أداة EDGE؛ لتحسين أساليب ترتيب متواليات الجينوم الكامل لفيروس الضنك في دراسة نُشِرَت في يونيو الماضي2.

ويمكن للمستخدمين استكشاف مجموعات البيانات هذه وغيرها بواسطة نسخة تجريبية مجانية يستضيفها خادم LANL. ويتعين على الباحثين الذين يودون تحليل تسلسلاتهم المتعاقبة تثبيت البرنامج على أنظمتهم الخاصة. ومن الممكن تنزيل شفرة البرنامج بِحُريَّة من موقع GitHub، وتُتاح أيضًا حاوية Docker، وصورة لجهاز افتراضي، ولكنْ سيتطلب الأمر - على الأرجح - خبير تكنولوجيا معلومات؛ للقيام بعملية التثبيت، حسب قول تشين. ومن الممكن تعديل شفرة المصدر؛ لإضافة أدوات، وتدفُّق أعمال أخرى، لكن تشين يقرّ بأن هذا يتجاوز قدرات كثير من المستخدمين، مضيفًا أن ثمة آلية، يجري تطويرها حاليًا؛ لتبسيط العملية.

يقول بادين - الذي يتمتع بخلفية جيدة في مجال علوم الحاسوب - إن بساطة الأداة تجعل علم الأحياء الحاسوبيّ مُتاحًا للباحثين، الذين ربما يتخوفون من الأداة التقليدية لأعمال المعلوماتية الحيوية، المتمثلة في حاسوب سطر الأوامر المعتمدة على النص.

هذا.. في حين يحذِّر تيتوس براون - عالِم الحاسوب في جامعة كاليفورنيا بمدينة ديفيس - من أن بعض مزايا EDGE تُقَوِّضها عيوب، من الممكن أن تحدّ من الاستعمال طويل الأجل للبرنامج. ويصف براون الأداة بأنها مثال على "البرمجيات العنيدة". ويضيف قائلًا: "إنها تعطيك مجموعة صغيرة من البرمجيات لتشغيلها متناغمة مع مجموعة محددة من الأمثلة، كما تقدِّم لك ملخصات ومخرَجات رسومية جميلة"، لكنه يشير إلى أنه ليس من الواضح كيف يمكن للباحثين الآخرين المساعدة في تطوير الأداة، ولا ما يمكن أن يحدث، إذا ما توقف تمويلها.

يقول تشين إن فريق التطوير جعل أداة EDGE مفتوحة المصدر، وهو ما يرجع - جزئيًّا - إلى المخاوف التي تحدوه بشأن التمويل المستقبليّ، والتي انتقلت أيضًا إلى خطط التطوير المستقبلية. يقول تشين: "إن الاستدامة مسألة يتعيَّن علينا بحثها، ولذا.. سنحاول أن نسمح لمطورين من طرف ثالث بتثبيت مشروعاتهم، وتشغيلها ببساطة أكبر، وذلك - على الأرجح - باستخدام منصة Docker".

أدوات جلاكسي

إنّ أداة EDGE ليست نظام المعلوماتية الحيوية الأول من نوعه الذي يقدم واجهة مستخدِم سهلة الاستعمال، فمنصة "جالاكسي" التي نُشرت3 لأول مرة في عام 2005 تسمح للباحثين بجمع خطوط معلوماتية من صندوق أدوات ضخم ومرن من البرمجيات المجانية المُقَدَّمَة عبر واجهة قائمة على الويب. ويمكن للمستخدمين حل أيّ مشكلة تخطر على بالهم تقريبًا بالجمع ما بين هذه الأدوات بعدة طرق مختلفة.

ومن الممكن أن يهاب المستخدمون استعمال منصة جالاكسي. وعلى العكس من تمثيلات الرسوم البيانية التي تولِّدها أداة EDGE، مثل أشجار التطور، أو مخططات "كرونا" التفاعلية للبيانات التصنيفية في الرسوم البيانية الدائرية الهرمية، تميل مخرجات جالاكسي إلى تبنِّي شكل ملفات البيانات المُعَالَجَة، التي يحتاج المستخدِم الانتقال بها إلى مكان آخر؛ لعرضها عرضًا مرئيًّا.

يقول جيريمي لايبتزدج، مطوِّر البرمجيات في قسم نظم المعلومات البيولوجية الطبية والصحية في مستشفى فيلادلفيا للأطفال بولاية بنسلفانيا: "منصة جالاكسي أشبه بالمطبخ، غير أنها لا تحوي غرفة طعام. فالنظام ليست غايته - في واقع الأمر - الوصول إلى طريقة لتقديم المخرَجات بطريقة جذابة. أما EDGE، فقد فكّر مطوِّروها فعلًا في الشكل الذي ينبغي أن تكون عليه التقارير".

ويقول ناثان واطسون-هاي، أخصائي المعلوماتية الحيوية بجامعة أديليد في أستراليا، إن أداة EDGE يمكن أن تساعد في تخفيف الضغوط التي يعاني منها أخصائيو المعلوماتية الحيوية المُنْهَكون من فرط العمل، غير أنه يُحَذِّر من أنها تظل أداة مُعَقَّدة للمعلوماتية الحيوية، ومن الحكمة أن يستشير علماء الأحياء - غير الخبراء بالحوسبة – خبيرًا، قبل الاطمئنان بشكل مُبالَغ فيه لنتائجهم.

وتضيف كاثلين فيش - المدير المؤقت لمركز البيولوجيا ونظم المعلومات الحوسبية في جامعة كاليفورنيا بمدينة سان دييجو قائلة إنه كما هو الحال مع أيّ أداة، عليهم فَهْم الإجراءات التي تقوم بها الخوارزميات، وكيف تؤثر المُعَامِلات المختلفة على مخرَجاتهم.. فلا تعني مجرد قدرتك على تشغيل الأدوات أنه ينبغي عليك تشغيلها".

ورغم ذلك.. فبينما تزداد أدوات المعلوماتية الحيوية سهولة، من الممكن أن تفقد شيئًا من هالتها المُعقدة. وبالنسبة إلى علماء الأحياء، من الممكن أن يؤدي ذلك إلى تبنِّيها؛ وإتاحتها على نطاق أوسع.

References

  1. (Li, P.-E. et al. Nucleic Acids Res. 45, 67–80 (2017
  2. (Cruz, C. D. et al. J. Virol. Methods 235, 158–167 (2016
  3. (Giardine, B. Genome Res. 15, 1451–1455 (2005