صندوق الأدوات

مستودعاتٌ لصور أبحاث علوم الحياة

تتيح هذه المستودعات للباحثين تخزين صور أبحاث علوم الحياة، ومشاركتها، والوصول إليها، وربما حتى استنباط نتائج جديدة منها.

آمبِر دانس

  • Published online:

ILLUSTRATION BY THE PROJECT TWINS

حين شرع الباحث شورز شيريز في محاولاته لتطوير أداةٍ لإصلاح عيوب صور تقنية الفحص المجهري الإلكتروني بالتبريد، كان يحتاج إلى كثيرٍ من البيانات لاختبار أداته. لذا.. لجأ شيريز -عالِم البيولوجيا البنيوية في مختبر البيولوجيا الجزيئية (LMB)، التابع لمجلس البحوث الطبية (MRC) في مدينة كامبريدج بالمملكة المتحدة- إلى الأرشيف العام لصور الفحص المجهري الإلكتروني (EMPIAR)، وهو قاعدة بيانات للصور الأولية. وهناك حمَّل مجانًا بياناتٍ جمعها مختبر جابرييل لاندر، عالِم البيولوجيا البنيوية في معهد سكريبس للأبحاث، الواقع في مدينة لا هويا بولاية كاليفورنيا.

وتمكَّن شيريز -باستخدام تقنيته الجديدة- من استخلاص صورٍ أوضح باستخدام تلك البيانات، فنجح -على سبيل المثال- في تحسين1 دقة إحدى البِنَى من 3.1 أنجستروم إلى 2.3 أنجستروم.

وقال لاندر عن ذلك: "لهذا بالضبط نشرنا تلك البيانات. كنا نعرف أنَّه سيكون هناك بعضٌ ممن يتمتعون بالبراعة، الذين سيتمكنون من تحسين عمليات معالجة البيانات التي أجريناها".

توفِّر مثل هذه الخدمة الأرشيفية للباحثين موقعًا مركزيًّا، يمكنهم فيه تخزين صور البحوث البيولوجية التي تتزايد أعدادها سريعًا. كما تتيح لهم مشاركتها والوصول إليها. يقول جوشوا فوجلستاين، وهو متخصص في علم إحصاءات الشبكات العصبية بجامعة جونز هوبكنز في مدينة بالتيمور بولاية ميريلاند: "البيانات لم تَعُد مجرد صورةٍ واحدة"، إذ يمكن للأفلام، والصور ثلاثية الأبعاد، وبيانات الفحص المجهري أن تشغل مساحاتٍ بالجيجابايت، أو التيرابايت من ذاكرات التخزين، ولا يمكن تبادل هذه الملفات عبر البريد الإلكتروني، مثل ملفات الصور المفردة، الموجودة في صيغة TIFF، أو JPEG. وإضافةً إلى ذلك.. يتزايد عدد وكالات المِنَح والدوريات التي تشترط على العلماء إتاحة بياناتهم للجميع، لكنْ لا يعرض جميعها استضافة تلك البيانات. وهذه الفجوة تسدّها الخدمات، مثل الأرشيف العام لصور الفحص المجهري الإلكتروني، وما يشبهه، وكثيرًا ما توفر هذه الخدمات مُعرِّفًا للمواد الرقمية، أو أداةً أخرى للاستشهادات المرجعية، حتى يمكن نَسْب البيانات إلى الباحثين الذين أنتجوها.

ومن هنا، يقول فورِست كولمان، عالِم الأعصاب بمعهد آلين لعلوم الدماغ في مدينة سياتل بولاية واشنطن: "إنْ كنتَ تجد صعوبةً في تحميل صورك، وعلى وجه الخصوص في مشاركتها، فمِن العمليّ إذَن أنْ تطَّلِع على هذا النوع من الخدمات".

ففي عام 2019، عندما اكتشف كولمان خليةً عصبية غريبة الشكل في واحدةٍ من مجموعات بيانات التصوير المجهري الإلكتروني الخاصة به2، كان من السهل عليه أن يرسل إلى زميلةٍ له رابطًا للموضع الذي عثر فيه على الخلية بمستودع البيانات، بدلًا من أن يرسل إليها ملفًّا ضخمًا. وقد لاحظت زميلته هذه سمةً أخرى فريدة في الموضع، وتعرَّف كولمان على بضع خلايا مماثلة. وعلى حد قوله، فقد يتبين في النهاية أنَّ هذه الخلايا هي نوعٌ جديد من الخلايا العصبية.

وهناك مستودعاتٌ أخرى كثيرة متاحة لتخزين الصور، منها مورد «إيمِدج داتا ريسورس» Image Data Resource (IDR). وهذا المورد، إلى جانب الأرشيف العام لصور الفحص المجهري الإلكتروني، يستضيفهما معهد المعلوماتية الحيوية الأوروبي، التابع لمختبر البيولوجيا الجزيئية الأوروبي (EMBL-EBI) في مدينة هينكستون بالمملكة المتحدة. ومن الخيارات الأخرى أيضًا منصّة «نيوروداتا» NeuroData -التي أنشأها فوجلستاين؛ لاستضافة ملفات التشريح العصبي- وقاعدة بيانات علم أنظمة الديناميكا البيولوجية (SSBD)، التابعة لشبكة المعاهد البحثية اليابانية «رايكِن» RIKEN. ويتوقع أنصار هذه المنصّات أن تكون على غرار موارد البيانات العريقة الخاصة بتسلسلات الأحماض النووية والبروتينات، مثل قاعدتَي بيانات «جين بانك» GenBank، و«بروتين داتا بانك» Protein Data Bank، اللتين استندت إليهما مجموعةٌ كبيرة من التحليلات، وظهر بناءً عليهما مجال نُظُم المعلومات الحيوية.

وعن تلك المستودعات، يقول جيسون سويدلو، أستاذ علم البيولوجيا الكمية للخلايا في جامعة دندي بالمملكة المتحدة: "نحن في مرحلةٍ مبكرة للغاية"، لكنَّه يتوقع أن تكون لهذه المستودعات فوائد كبيرة، سواءٌ للعلماء الذين يحمِّلون مجموعات صور ضخمة، لتغذية خوارزميات تعلُّم الآلة، التي تحتاج قدرًا هائلًا من البيانات، أَم لأولئك الذين قد يتمكنون من الوصول إلى اكتشافاتٍ جديدة في بيانات الآخرين.

مشارَكة تعود بالفائدة على الجميع

كان تعطُّش المجتمع العلمي للبيانات هو ما دفع كيت ماكدول -المتخصصة في البيولوجيا النمائية بمختبر البيولوجيا الجزيئية- إلى استخدام قاعدة بيانات خاصة بتخزين الصور.

ففي أثناء عملها بمجمع أبحاث جانيليا -التابع لمعهد هوارد هيوز الطبي، والواقع في مدينة آشبورن بولاية فرجينيا- التقطت صورًا لعددٍ من أجنة الفئران أثناء نموها، كل خمس دقائق، منتِجةً بياناتٍ يُقدَّر حجمها بالتيرابايت، بالإضافة إلى أطلس من الصور عالية الدقة لنمو الفئران3، أثار اهتمامًا كبيرًا. وقالت عن ذلك: "يسألني الناس دائمًا: هل فحصتِ هذا النسيج، هل فحصتِ ذاك؟". ولذلك.. بحثَتْ عن وسيلةٍ لمشاركة كل هذه البيانات.

وقد عرضَتْ عليها الدورية التي ستنشر بحثها فيها مساحة تخزين تُقاس بالجيجابايت، أي أقل بكثير مما تحتاجه؛ فقالت عن هذا ساخرةً: "يا لذلك..، مساحة بالجيجابايت. هذا ظريف حقًّا". لذا.. حمَّلت ماكدول الأطلس على مورد «إيمدج داتا ريسورس»، وهو خدمةٌ مجانية، طَوَّرها سويدلو وزملاؤه. وقالت إنَّ نقل البيانات استغرق أسبوعًا تقريبًا، لكن الآن، يمكن لأي شخصٍ لديه متصفح إنترنت أن يستعرض مجموعة بياناتها، ويعثر على الأنسجة المفضلة لديه، أو يقارن نتائجه بنتائجها. وكثيرًا ما تستخدم ماكدول نفسها موردَ «إيمدج داتا ريسورس» في المؤتمرات، لعرض البيانات غير المخزَّنة على حاسوبها المحمول لزملائها.

ويقول جان إلينبِرج -عالم البيولوجيا الخليوية والجزيئية في مختبر البيولوجيا الجزيئية الأوروبي بمدينة هايدلبرج الألمانية- إنَّ قواعد البيانات هذه توفر ما هو أكثر من مساحة تخزين، وعليه، لا ينبغي للباحثين الاكتفاء بإيداع مجموعات بياناتهم في أرشيفاتٍ صغيرة خاصة بمشروعات معينة، أو مساحة تخزين سحابية عامة. وأضاف معللًا لذلك: "مجرد إيداع البيانات في مكانٍ ما لا يعني أنَّ الناس يمكنهم استخدامها. ينبغي عليك تنظيم البيانات، وإضافة التعليقات التوضيحية لها، وإدارتها". فعلى سبيل المثال.. يمكن لمتصفحي مجموعة بيانات ماكدول الاطلاع على بياناتها الوصفية، لمعرفة معلوماتٍ معينة، مثل سلالة الفئران التي استخدمتها، والواسمات الفلورية المحددة التي صوَّرَتها.

ويؤيد هذا الرأي باتريك كومبس، المدير الفني العالمي لقسم الرعاية الصحية وعلوم الحياة في شركة «أمازون ويب سيرفيسز» Amazon Web Services في مدينة سياتل الأمريكية، إذ يقول: "تخزين مجموعات البيانات في خدمة أمازون لا يحسنها تلقائيًّا"، لكنَّه يضيف قائلًا إنه إذا أُتيح للعلماء معالجة البيانات، وإدارتها، وإضافة التعليقات التوضيحية لها، يمكن لخدمة أمازون أن تصبح مكانًا آمنًا وموثوقًا فيه لاستضافة البيانات. وتستضيف الخدمة بالفعل عديدًا من موارد البيانات المستخدَمة على نطاقٍ واسع، منها البيانات الأولية لمرصد «ألين برين» Allen Brain Observatory، ومنصة «نيوروداتا».

ويمكن للباحثين عادةً تحميل بياناتهم على قواعد البيانات الخاصة بصور أبحاث علوم الحياة، دون أي تكلفة، إذ كثيرًا ما تموِّل المِنَح أو جهات مانحة أخرى عمليات تخزين هذه البيانات، وإدارتها، وصيانتها. فعلى سبيل المثال.. حصل سويتشي أونامي -عالِم البيولوجيا النمائية في مركز «رايكن» لأبحاث ديناميّات النظم البيولوجية في مدينة كوبي اليابانية، الذي أسس قاعدة بيانات علم أنظمة الديناميكا البيولوجية- على تمويلٍ من مؤسساتٍ عدة، منها: «رايكن»، والوكالة اليابانية للعلوم والتكنولوجيا، ووزارة التعليم والثقافة والرياضة والعلوم والتكنولوجيا في اليابان. ويقول أونامي إنَّ قاعدة البيانات التي أسسها "مجانية تمامًا" للمستخدمين. وهو الآن يوسع نطاقها، بحيث لا يقتصر على علم البيولوجيا النمائية، وليشمل هذا النطاق أي مجموعة بيانات بيولوجية تتضمن معلوماتٍ زمانية ومكانية، فضلًا عن الصور الثابتة التي تُلتقط بأحدث التقنيات.

ويكون عادةً تنزيل مجموعات البيانات مجانيًّا أيضًا، وكذلك يمكن إعادة استخدامها ونشرها مجانًا في كثيرٍ من الأحيان، إذ كثيرًا ما تَستخدِم تلك المستودعات رُخَص المشاع الإبداعي، التي تعلن إتاحة تلك البيانات.

خيارات عديدة

تختلف قواعد البيانات هذه عن بعضها في أحجام الملفات التي تقبلها، والمجالات البحثية التي تركز عليها، ومن حيث ضرورة ارتباط الصور فيها بدراسةٍ منشورة. وإذا كان المجتمع العلمي الذي تنتمي إليه يملك بالفعل قاعدة بياناتٍ متخصصة، فإنَّ فوجلستين يوصي باستخدامها.

وغير أن هناك مستودعات عامة، منها مستودع «فيجشير» Figshare -على سبيل المثال- الذي يقبل أي نوعٍ من البيانات مجانًا، بمساحةٍ أقصاها 5 جيجابايت لكل ملف. وذلك الحد الأقصى يمكن زيادته في بعض الأحيان، حسبما أوضح مؤسس المستودع مارك هانيل، إذ يُقَدَّر حجم أكبر مجموعة بيانات على «فيجشير» بالتيرابايت (المستودع مملوك لشركة «ديجيتال ساينس» Digital Science، وهي شركة تديرها مجموعة «هولتز برينك» للنشر Holtzbrinck Publishing Group، التي تملك حصةً من أسهُم شركة «سبرينجر نيتشر» Springer Nature، ناشرة دورية Nature). وتشمل الخدمات المجانية الأخرى التي تقبل أنواعًا مختلفة من البيانات مستودعات «زينودو» Zenodo، و«دراياد» Dryad.

تربط مستودع «فيجشير» أيضًا صلات تعاقدية مع جهاتٍ مختلفة، منها جامعاتٌ، وممولون، وناشرون (بما في ذلك شركة «سبرينجر نيتشر»). وهذه الجهات تدفع رسومًا سنوية مقابل التمتع بمزايا إضافية. ففي العام الماضي، على سبيل المثال، أنشأ «فيجشير» مستودعًا لبيانات الأبحاث التي تمولها وكالة معاهد الصحة الوطنية الأمريكية (NIH)، والتي تطلب الآن من متلقي مِنَحها إتاحة نتائجهم مجانًا. وهذا المستودع مخصص للبيانات التي لا تستوفي بدقة معايير المستودعات ذات الموضوعات المحددة، ويستضيف حاليًا العشرات من مجموعات البيانات. وبعكس الحال مع الخدمات التي يوفرها «فيجشير» في المعتاد، تتحكم وكالة معاهد الصحة الوطنية الأمريكية في هذا المستودع، من ناحية أنواع المحتوى المسموح بها على سبيل المثال، والبيانات الوصفية المطلوبة. ويستفيد الحاصلون على منح الوكالة من المساعدة التي يتلقونها لوضع البيانات الوصفية لمجموعات البيانات التي يقدمونها، إضافةً إلى ميزاتٍ أخرى.

أمَّا قاعِدتا بيانات «إيمدج داتا ريسورس»، وإحداهما مخصصة لصور الخلايا، والأخرى لصور الأنسجة، فتخضعان لإدارةٍ محكمة، حسبما أوضح سويدلو. ويحاول هو وغيره من القائمين على إدارتها استضافة مجموعات البيانات المرجعية المرتبطة بالأبحاث المنشورة، مثل نتائج دراسات المسح الكبيرة، التي قد يستفيد منها جمهورٌ عريض. كما يحرصون على تنسيق البيانات بشكلٍ صحيح، وإضافة البيانات الوصفية المناسبة إليها، مثل نوع المجهر المستخدَم، والعلاجات التجريبية المطبقة.

وفي يوليو الماضي، أعلن معهد المعلوماتية الحيوية الأوروبي -القائم على مختبر البيولوجيا الجزئية الأوروبي- إنشاء خدمةٍ تُسمَّى «بيو إيمدج أركايف» BioImage Archive، وهي خدمة ستستضيف مستودعي «إيمدج داتا ريسورس»، والأرشيف العام لصور الفحص المجهري الإليكتروني، بالإضافة إلى قاعدة بيانات «بيو ستاديز» BioStudies الأكثر عمومية. وتقول جو ماكنتاير -المديرة المساعدة لإدارة الخدمات في معهد المعلوماتية الحيوية الأوروبي- إنَّ المعهد سيدعم في المستقبل مزيدًا من قواعد البيانات المُدارة، والمخصصة لمجتمعاتٍ علمية معينة. ووعدت بأنَّه من خلال الدعم الذي يوفره مختبر البيولوجيا الجزيئية الأوروبي، ووكالة البحث والابتكار في المملكة المتحدة المعنية بالتمويل، سيستمر عمل خدمة «بيو إيمدج أركايف»، ما دامت "مفيدةً من الناحية العلمية". كما يقول هانيل إنَّ مستودع «فيجشير» سيستمر "إلى الأبد"، رغم أنَّه يعترف بأنَّ عقد عمله لا يضمن استمراره إلَّا لعشر سنواتٍ فقط. وأضاف: "نقوم بجميع الأعمال الأساسية المملة، حتى نضمن استمرار هذه البيانات".

بيانات الآخرين

تسهل هذه الخدمات العثور على مجموعات البيانات الكبيرة، ومشاركتها، وتخزينها. وكما هو الحال مع قواعد بيانات الأحماض النووية والبروتينات، يُؤمَل أن يتوصل متصفحو الصور -من خلال تلك الخدمات- إلى اكتشافاتٍ علمية جديدةٍ في بيانات غيرهم.

ولإثبات إمكانية تحقيق ذلك، فحص سويدلو وزملاؤه بعناية صور ثلاث دراساتٍ منفصلة عن استطالة الخلايا في مستودع «إيمدج داتا ريسورس». تتعلق اثنتان من تلك الدراسات بخط الخلايا السرطانية البشرية، المعروف باسم «هيلا» HeLa، أمَّا الثالثة، فتتناول خلايا الخميرة الانقسامية. وتفتقر الأنواع الثلاثة للخلايا المصورة جميعًا إلى مجموعةٍ متنوعة من الجينات. ويقول سويدلو عن الدراسات الثلاث: "كل دراسة توصلت إلى نتائج مختلفة، لكنَّها نتائج مرتبطة جميعًا ببعضها". وقد سمحت هذه الدراسات الثلاث معًا له ولفريقه بتحديد شبكةٍ أكبر وأكثر اكتمالًا من الجينات المرتبطة بعملية الاستطالة، مقارنةً بما أمكنهم تحديده باستخدام أيّ مجموعة مفردة من مجموعات البيانات الثلاث4.

وتشير دراسةٌ5 نُشرت على خادم نُسَخ ما قبل النشر بمستودع «أركايف» ArXiv في العام الماضي إلى أنَّه من بين حوالي 532 ألف بحثٍ نشرتها دوريات «بلوس» PLOS، و«بيوميد سنترال» BioMed-Central، حازت الأبحاث التي تضمنت رابطًا يقود إلى مستودع بيانات عدد استشهاداتٍ أكبر بنسبة 25%، مقارنةً بغيرها.

ويرى سويدلو أنَّه مع تطوُّر قواعد بيانات الصور بمرور الوقت، فإنَّها قد تؤدي إلى ما هو أكثر من تلك الاكتشافات الجديدة، التي تحدث بين الحين والآخر، إذ إنَّ مجال نُظُم المعلومات الحيوية نفسه خرج من رحم أرشيفات بيانات الأحماض النووية.

وأضاف: "نأمل أن ينتهي الأمر بنا إلى تشجيع تطور مجالاتٍ بأكملها".

References

  1. Zivanov, J., Nakane, T. & Scheres, S. H. W. IUCrJ https://doi.org/10.1107/S2052252520000081 (2020). | article
  2. Dorkenwald, S. et al. Preprint at bioRxiv https://doi.org/10.1101/2019.12.29.890319 (2019).
  3. McDole, K. et al. Cell 175, 859–876 (2018). | article
  4. Williams, E. et al. Nature Meth. 14, 775–781 (2017). | article
  5. Colavizza, G., Hrynaszkiewicz, I., Staden, I., Whitaker, K. & McGillivray, B. Preprint at https://arxiv.org/abs/1907.02565 (2019). 

آمبر دانس صحفية علمية مستقلة، تقيم بالقرب من مدينة لوس أنجيليس في ولاية كاليفورنيا.