تحقيقات

المتاهة: كيف ضرب الارتباك مجال دراسات الجينوم؟

كان تبادل المعلومات تبادلًا حرًّا وآنيًّا من المقوِّمات الأساسية لنجاح مشروع الجينوم البشري، قبل عشرين عامًا. أما اليوم، فقد أصبحت دراسات الجينوم تواجه تحدياتٍ كبيرة، تعوق إمكانية الوصول إلى بياناتها.  

كيندال باول
  • Published online:

Illustration by Ana Kova

كان ذلك في شهر يوليو من عام 2000، حين طالَع ديفيد هاوسلر على شاشة حاسوبه أول جينوم بشري مُجمَّع بالكامل. ويسترجع تلك اللحظة قائلًا إنه لم يتمالك دموعه من فرط التأثُّر. فبالتعاون مع زميله جيم كِنت، الذي كان حينها طالبًا في مرحلة الدراسات العليا، عمل هاوسلر على تصميم أول أداة على الويب لاستكشاف حروف الجينوم البشري، البالغ عددها ثلاثة مليارات. وقد نشر الباحثان على الإنترنت المسودة الأولية للجينوم، بعد 11 يومًا فقط من الانتهاء من تلك المهمة الشاقة -مهمة تجميع الجينوم بالكامل- التي أُسندت إليهما ضمن مشروع الجينوم البشري (HGP)، وهو مشروع تعاوني عالمي، ظل يسعى إلى بلوغ هذا الهدف على مدى عقدٍ كامل. ولم ينشر الفريق تحليله للجينوم على صفحات دورية Nature1 إلا بعد عدة أشهر، غير أنَّ البيانات كانت جاهزةً للمشاركة.

يشغل هاوسلر حاليًّا منصب المدير العلمي لمعهد سانتا كروز لعلوم الجينوم بجامعة كاليفورنيا. ويتذكر قائلًا: "لقد عايشنا تلك اللحظة؛ لحظة خروجه إلى العالَم بأسره". وسرعان ما أصبح بإمكان أي شخصٍ في العالم تفحُّص الجينوم البشري على شبكة الإنترنت: كروموسومًا كروموسومًا، وجينًا جينًا، وقاعدةً قاعدة.

كانت لحظةً تاريخية، حسب وصف هاوسلر؛ فقبل انطلاق مشروع الجينوم البشري، في أوائل التسعينيات من القرن الماضي، "لم تكن هناك نقاشاتٌ جادة حول مشاركة البيانات في أبحاث الطب الحيوي. وكان المعتاد بين الباحثين أن يستأثر كل باحث يُصيب نجاحًا ببياناته لنفسه لأطول فترةٍ ممكنة". غير أنَّ هذا السلوك لم يكن ليناسب ذلك المشروع التعاوني الضخم، فلو كان كل عالِمٍ أو بلدٍ قد ضنَّ ببياناته على غيره، لَحِيلَ بين هذا المشروع وبين بلوغ أهدافه. ومن هذا المنطلَق، اجتمع باحثو المشروع في عام 1996، لوضع ما أصبح يُعرَف باسم "مبادئ برمودا". ولم ينته ذلك الاجتماع إلا وقد اتفق جميع الأطراف على إتاحة التسلسلات الجينومية البشرية في قواعد بيانات عامة خلال 24 ساعة من تحديدها، دون إبطاءٍ أو استثناءات.

وها قد مرَّ عقدان على تلك اللحظة، وأصبح لدينا مِن البيانات الجينومية ما يفوق قدرة المجال على استيعابه، وذلك بسبب التقنيات المتطورة التي نستعين بها في تحديد تسلسلات الجينومات الكاملة، وتعيين أنماطها الجينية من خلال تحديد تسلسلات بضعة ملايين من مناطق محددة، سعيًا إلى الوقوف سريعًا على ما فيها من تبايناتٍ. وقد أثمرت تلك الجهود تمثيلاتٍ للتسلسلات الجينية الخاصة بعشرات الملايين من البشر، وهي متاحة حاليًّا في مستودعات بيانات بمختلف أنحاء العالم. فبموجب المبادئ التي وُضعت لدى إطلاق مشروع الجينوم البشري، والتي تبنتها بعد ذلك الدوريات العلمية ومؤسسات التمويل، ينبغي أن تُتاح للجميع إمكانية الاطلاع على البيانات التي جُمعت لأجل إجراء الدراسات الجينومية المنشورة، وكذا إمكانية الاعتماد على تلك البيانات في تحقيق اكتشافاتٍ جديدة.

لكنْ ليت الأمر كان بهذه البساطة! فغزارة تدفق البيانات دفعت المعاهد البحثية، والحكومات، ومؤسسات التمويل، والاتحادات البحثية الخاصة، إلى إنشاء قواعد بيانات خاصة بها، مصممة وفقًا لمتطلباتٍ معينة، وذلك لإدارة تلك البيانات المعقدة، التي أحيانًا ما تكون حساسة. وهذه المستودعات العديدة تختلف فيما بينها اختلافًا كبيرًا، وتضع قواعد متباينة للاستفادة من بياناتها، وتفتقر إلى طريقةٍ موحَّدة لتنسيقها؛ ما دفع هاوسلر إلى استحضار "برج بابل" -الذي يرمُز إلى معاني التشتُّت، والفُرقة، و"البلبلة"- في وصف الوضع القائم لدراسات الجينوم.

في عام 2000، حين كان جيم كِنت لا يزال طالبًا في مرحلة الدراسات العليا بجماعة كاليفورنيا في مدينة سانتا كروز، أسهم في تجميع نتائج مشروع الجينوم البشري، الذي استمر العمل عليه عشر سنوات، ومشاركة هذه النتائج مع الجميع.

في عام 2000، حين كان جيم كِنت لا يزال طالبًا في مرحلة الدراسات العليا بجماعة كاليفورنيا في مدينة سانتا كروز، أسهم في تجميع نتائج مشروع الجينوم البشري، الذي استمر العمل عليه عشر سنوات، ومشاركة هذه النتائج مع الجميع. 

© Replace me

ورغم عزوف بعض الباحثين عن مشاركة البيانات الجينومية، يُعتبر هذا المجال أكثر سخاءً من غيره في هذا الصدد. إلا أنَّ مستودعات البيانات هذه، التي يُفترض أن تعزِّز مفهوم المشاركة، كثيرًا ما تقف حائلًا أمام من يُقْدِمون على تحميل البيانات عليها، وتنزيلها. فقد ذكر باحثون أنَّهم يقضون شهورًا أو سنوات في تتبع مجموعات البيانات، ثم إذا بجهودهم تضيع هباءً، لعجزهم عن الحصول على تلك البيانات، أو لعثورهم على ملفاتٍ غير صالحة للاستخدام. كما أنَّ محرري الدوريات العلمية ومؤسسات التمويل يجدون مشقةً كبيرة في التحقُّق من مدى التزام العلماء ببنود اتفاقياتهم.

والحق أن الكثيرين من العلماء يعملون جاهدين على تغيير هذا الوضع، آملين تجسيد هذا التغيير على أرض الواقع في أقرب وقتٍ ممكن.

وحول هذا الشأن، تقول هايدي ريم، المتخصصة في علم الجينوم الإكلينيكي، إنَّ باحثي المجال أصبحوا يدركون أنَّ قَطْع خُطًى واسعة على طريق التقدم العلمي في هذا المضمار يستلزم كمياتٍ ضخمة من البيانات الجينومية المرتبطة بالأمراض، وبيانات السمات الصحية. وتستدرك ريم، التي تعمل في كلٍّ من مستشفى ماساتشوستس العام في بوسطن، ومعهد برود في كامبريدج، قائلة: "غير أنَّ هذه البيانات غير متوافقة مع بعضها، ولا يمكن مشاركتها؛ إذ كيف يتأتى لنا إقناع جميع الأشخاص المعنيين في شتى أنحاء العالم -المرضى منهم، والباحثين، والأطباء الإكلينيكيين- بمشاركة بياناتهم؟".

عقباتٌ جمَّة

أتاح لنا تحديد تسلسل الجينوم البشري دراسة الأمراض المرتبطة بالطفرات في جيناتٍ بعينها، ومنها الاضطرابات المندلية، مثل حالة فقدان السمع غير المصحوبة بأعراضٍ أخرى2 ومع ذلك، فلِكَي يتسنى لنا تحديد الأسس الجينية للأمراض المعقدة الأكثر انتشارًا، مثل أمراض القلب والأوعية الدموية، والسرطان، وغيرها من المسببات الرئيسة للوفاة، كان لا بد من الكشف عن عوامل الخطر الجينية المختلفة في جميع أجزاء الجينوم. ولتحقيق هذا، بدأ الباحثون في منتصف العقد الأول من هذا القرن في المقارنة بين الأنماط الجينية لعددٍ هائل من الأشخاص، يتراوح بين الآلاف ومئات الآلاف، بعضهم يعانون من أمراضٍ أو حالاتٍ مرضية محددة، وذلك من خلال نهجٍ يُعرَف باسم دراسات الارتباط على مستوى الجينوم (GWAS).

لاقى هذا النهج إقبالًا كبيرًا، إذ أُجريت أكثر من 10,700 دراسة من هذه الدراسات منذ عام 2005 حتى اليوم، وهو ما أسفر عن فيضانٍ من البيانات، بحسب وصف الباحث تشيا تشون كور، الذي يقود فريقًا في معهد علوم الجينوم بسنغافورة، ويختص بدراسة الأساس الجيني لمرض الجلوكوما (المياه الزرقاء). وأوضح أنَّنا لو أجرينا دراسةً تتضمن 10 آلاف شخص، لدراسة مليون تسلسلٍ جيني محدد لدى كل واحدٍ منهم، على سبيل المثال، فسوف تكون محصِّلة تلك الدراسة جدولًا يضم 10 مليارات عنصر بيانات.

تجدُرُ الإشارة إلى أن غالبية هذه البيانات الجينومية الخاصة بالأفراد مودَعة حاليًّا في قواعد بيانات "مُقيَّدة الوصول"؛ أي خاضعة لقيودٍ، بحيث لا تسمح بالوصول إليها إلا بشروطٍ معينة. وُضعَتْ هذه القواعد للتعامل مع المخاوف القانونية والأخلاقية الإشكالية، التي تصاحِب مثل هذه البيانات الجينومية المرتبطة بالمعلومات الشخصية عن هؤلاء الأفراد، أي "بيانات الأنماط الظاهرية"، التي قد تتضمن سجلات الرعاية الصحية، أو الحالات المرضية، أو الاختيارات المتعلقة بحياتهم الشخصية. وحتى في حالة مجموعات البيانات المُجهَّلة، ليس من المتعذِّر تقنيًّا كشْف هويات أصحاب البيانات. لذا، فإنَّ قواعد البيانات مُقيَّدة الوصول تتحقق من هويات الباحثين الذين يسعون إلى الوصول إلى البيانات، وتتأكد من عدم استخدامها لغير الأغراض التي وافق عليها أصحابها.

فمِنْ بين المتطلَّبات التي تفرضها وكالة معاهد الصحة الوطنية الأمريكية (NIH)، على سبيل المثال، أنْ يضيف المتقدِّمون لنيل مِنَحها بيانات دراسات الارتباط إلى مستودع البيانات الرسمي للوكالة، الذي يُعرف بقاعدة بيانات الأنماط الجينية والظاهرية (dbGap). أمَّا الباحثون الأوروبيون، فبإمكانهم تخزين البيانات في الأرشيف الأوروبي للجينومات والأنماط الظاهرية (EGA)، الذي يستضيفه المعهد الأوروبي للمعلوماتية الحيوية (EMBL-EBI)، الواقع في مدينة هنكستون بالمملكة المتحدة. وبالمِثْل، تدير الجهات الكبرى الأخرى، المُنتِجة للبيانات الجينومية، قواعد بيانات مُقيَّدة الوصول، مثل شركة "توينتي ثري آند مي" 23andMe، الهادفة للربح، ويقع مقرها في مدينة سانيفيل بولاية كاليفورنيا الأمريكية، وشركة "جينوميكس إنجلاند" Genomics England، غير الهادفة للربح، ومقرها في لندن.

غير أنَّ تحميل البيانات على بعض هذه المستودعات غالبًا ما يستغرق وقتًا طويلًا. ومن ثمَّ، فإنَّ البيانات، حسب قول كور، كثيرًا ما تكون "محدودةً وشحيحة"؛ لأنَّ الباحثين لا يضيفون من البيانات سوى القدر الذي تقتضيه الاتفاقيات.

أضف إلى ذل، أنَّ البيانات تُخزَّن أحيانًا في أكثر من مكان؛ الأمر الذي تترتَّب عليه تحديات أخرى. تقول راسيكا ماثياس، المتخصصة في علم الوبائيات الجيني بجامعة جونز هوبكنز في مدينة بالتيمور بولاية ميريلاند الأمريكية، التي تعكف على دراسة الأسس الجينية لمرض الربو لدى الأشخاص ذوي الأصول الأفريقية، إنَّ هذه اللامركزية في تخزين البيانات تمثل مشكلةً كبيرة. تعمل الباحثة في برنامج "توب مِد" TOPMed، وهو برنامج للطب الدقيق، يديره المعهد الوطني لأمراض القلب والرئة والدم، التابع لوكالة معاهد الصحة الوطنية الأمريكية. يضم هذا البرنامج أكثر من 155 ألف مشارك، موزَّعين على أكثر من 80 دراسة، ويشارك بياناته في العديد من مستودعات البيانات، من بينها قاعدة بيانات الأنماط الجينية والظاهرية (dbGap)، وبعض المنصّات التي تستضيفها الجامعات.

ترى ماثياس أنَّ هذه البيانات "موردٌ متميز"، غير أنَّ العثور على جميع أجزاء البيانات المتاحة، وطلب الحصول عليها، يمثلان مهمةً شاقة ومعقدة بالنسبة إلى الباحثين غير التابعين للبرنامج؛ إذ غالبًا ما يتطلب ذلك منهم أن يتقدموا بأطروحات مفصَّلة، وكذلك خطابات دعم. وهذه، في رأي ماثياس، "تعقيدات لا داعي لها".

لذا، يبحث الكثيرون عن حلولٍ بديلة. ومن هؤلاء روث لوس، المتخصصة في علم الوبائيات الجيني بكلية طب آيكان في جامعة ماونت سايناي بمدينة نيويورك، التي تقول: "إنني شخصيًّا لا أميل إلى تحميل البيانات من قاعدة الأنماط الجينية والظاهرية، وإنما أقصد الباحثين مباشرةً، وأسألهم إنْ كانوا راغبين في التعاون". قبل عدة سنوات، حاولَتْ لوس الدخول إلى مجموعة بيانات مُخزَّنة على هذه القاعدة، وملأت دفعةً تلو الأخرى من النماذج والاستمارات الإلكترونية، لكنَّ طلبها قوبل بالرفض في النهاية. وأضافت الباحثة: "حتى مجرد تسجيل الدخول على قاعدة البيانات يمكن أن يكون مهمةً شاقة. إنَّها ببساطة ليست سهلة الاستخدام بالنسبة إلى الباحثين".

يُقِرّ بهذه المشكلة ستيفن شيري، القائم بأعمال مدير المركز الوطني لمعلومات التكنولوجيا الحيوية في مدينة بيثيسدا بولاية ميريلاند، التابع لوكالة معاهد الصحة الوطنية الأمريكية، الذي يدير قاعدة البيانات المذكورة؛ إذ يعترف بأنَّ إجراءات تقديم البيانات والوصول إليها "شاقة، ولا تخلو من أوجه القصور". زِد على ذلك أنَّ هذه البيانات المعقدة والمتنوعة تتطلب مراجعة كل حالةٍ على حدة، وليس في الإمكان تسريع وتيرة هذه المراجعة، من خلال تكليف المزيد من الأشخاص بتنفيذها مثلًا.

غير أنَّ الوكالة، وفقًا لشيري، تخصص بعض الموارد حاليًّا لتحديث المنظومة، حتى تصبح أكثر مرونة، وأسهل في الاستخدام. ومن جانبها، أفادت كاري فولينِتس، المديرة المشارِكة للسياسات العلمية بالوكالة، أنَّ الوكالة لم تقرر بعدُ ما إذا كانت ستتجه إلى علاج المشكلة عبر تصميم إصدارٍ ثانٍ من قاعدة البيانات، أم تطوير موردٍ بديل لها، وأوضحت قائلةً: "هل نتخذ إجراءً مؤقتًا لحل المشكلة، أم أنَّ الوقت قد حان للاستثمار في عملية إحلال وتجديد شاملة؟".

ورغم كل المشكلات التي تواجهها جهود مشارَكة البيانات الجينومية بسبب سياسات تقييد الوصول، يرى كثيرٌ من الباحثين أنّ قواعد البيانات المشابهة ما زالت عظيمة النفع، ومنها قاعدة بيانات الأنماط الجينية والظاهرية، والبنك الحيوي الخاص بالمملكة المتحدة، الذي يضم البيانات الجينومية لنصف مليون شخص. وعلاوةً على ذلك، تُبدِي ماثياس حرصًا شديدًا على حماية المشاركين في برنامج "توب مِد"، وترى أنَّ الحماية التي توفرها سياسات تقييد الوصول إلى البيانات لا تخلو من فائدة. إنها تتمنى -كما يتمنى الكثيرون- أن تُتاح لهذه المستودعات موارد أفضل، لكنّها تؤيد "وجود الضوابط والموازنات"، على حد قولها.

وهناك باحثون آخرون راضون بإمكانية الحصول على البيانات، حتى مع صعوبة الإجراءات. تقول ميلاني باهلو، التي تدير مختبرًا لعِلْم الجينات الإحصائي في معهد والتر وإلايزا هول للأبحاث الطبية في مدينة ملبورن الأسترالية: "إن إنتاج هذا القدر الهائل من البيانات مما يَخرُج عن نطاق عملنا". ومن ثمَّ، لا يجد مختبرها أية غضاضة في التعامل مع هذا الكم الكبير من النماذج والاستمارات الإلكترونية، في سبيل استخدام قاعدة بيانات الأنماط الجينية والظاهرية (وهذا ما فعله فريقها في أكثر من عشرة مشروعات). كما أنَّها أنفقَتْ مؤخرًا ستة أشهر سُدًى في محاولات العثور على مجموعة بيانات كان يُفترض أن تكون متاحةً للجميع من خلال منصة البيانات الخاصة بأحد المعاهد البحثية، لكنَّها لم تكن متاحةً في الواقع.

وفي تعليقه على ذلك، قال كور: "ليس هناك ما هو أصعب من الحصول على البيانات من قاعدة الأنماط الجينية والظاهرية، أو من الأرشيف الأوروبي، إلا محاولة الحصول عليها من باحثٍ لا يرغب في مشاركتها".

الرقابة على مشاركة البيانات

بعد مرور عشرين عامًا على انطلاق مشروع الجينوم البشري، ما زلنا لا نملك سياسةً عالمية مُحدَّدة تُلزِم المجموعات البحثية بمشاركة بيانات الجينومات البشرية، أو تفرض تنسيقًا محددًا، أو قاعدة بيانات معينة لمشاركتها. ومع ذلك، فهناك العديد من الدوريات العلمية التي استمرت في الامتثال لمبادئ برمودا، عبر إلزام الباحثين بمشاركة البيانات الجينومية في قواعد البيانات المُعتَمدة عند نشر الأبحاث؛ إلَّا أنَّ إنفاذ هذه السياسات يفتقر إلى العناية والتنظيم.

وعن ذلك، تقول ميشيل ترنكمان، كبيرة محرري موضوعات علوم الجينات والجينوم في دورية Nature في لندن، إنَّ الباحثين كثيرًا ما يعزفون عن مشاركة البيانات، متذرِّعين بالمخاوف المتعلقة بخصوصية المشاركين، أو التعهُّدات التي أخذوها على أنفسهم، أو اللوائح الوطنية، أو لوائح الشركات المنظِّمة لملكية البيانات. وأضافت ترنكمان: "اللافت للنظر أنَّه بينما ينتظر علماء الجينات من غيرهم مشاركة البيانات، نجدُ أنهم يمتنعون أحيانًا عن مشاركة بياناتهم". في هذه الحالات، تتصدَّى ترنكمان لهذا العزوف من جانب الباحثين، وإذا تعذَّر التغلب على التحديات، تُلْزِمهم بتوضيح أسبابهم مباشرةً في الأوراق المنشورة لغرض الشفافية (مع العلم أنَّ فريق الأخبار في دورية Nature مستقل تحريريًّا عن الفريق المسؤول عن الدورية).

أمَّا دورية "جينوم ريسيرش" Genome Research، فتتبع سياسة مُفادها أنَّه "لا استثناءات". وتوضح محررتها التنفيذية، هيلاري سوسمان، أنَّ المحررين عادةً ما يتعاونون مع الباحثين للتغلب على عقبات مشاركة البيانات، كل حالة على حدة، من أجل التوصل إلى حلولٍ من شأنها تذليل تلك العقبات. وقد يدفعهم هذا النهج إلى اتخاذ إجراءاتٍ استثنائية، مثل مطالبة الباحثين بإعادة التقدُّم للحصول على الموافقة من مجالس المراجعة المؤسسية المختصة، أو الرجوع إلى المشاركين في الدراسة للحصول على موافقتهم مرةً أخرى، أو إعادة إجراء التحليلات بعد حذف البيانات التي لا يمكن مشاركتها. وقد رفضت الدورية نشر أوراق الباحثين الذين صرَّحوا برفضهم مشاركة البيانات. وأضافت سوسمان أنَّ "المجتمع والممولين يطالبون بهذه الشفافية، وبإتاحة إمكانية التحقق من نتائج الأبحاث".

ولكن حتى عندما يوافق المؤلفون على مشاركة البيانات، يُلاحَظ أنَّ قدرة المحررين والمراجعين على التحقق من مدى التزامهم بفعل ذلك محدودة؛ إذ كثيرًا ما يعوزهم الوقت اللازم للتحقق من جودة البيانات، أو تنسيقها، أو اكتمالها، وفي بعض الأحيان، لا يُتاح لهم الاطلاع على قواعد البيانات مقيدة الوصول.

وبالنظر إلى هذه الاعتبارات جميعًا، تعتقد ترنكمان أنَّه ينبغي على جهات التمويل إلزام الباحثين بوضع خطةٍ محددة لمشاركة البيانات منذ بداية المشروع. وترى أنّ هذا من شأنه أن يساعد على تغيير مواقف الباحثين، بحيث تصبح مشاركة البيانات في نظرهم أمرًا واجبًا.

وهذا ما يُنتظر أن تحققه سياسة مشاركة البيانات، المُزمَع تطبيقها على مستوى معاهد الصحة الوطنية الأمريكية في شهر يناير عام 2023؛ فسوف تُلزِم هذه السياسة جميع المتقدمين للحصول على المنح بوضع خطة لإدارة البيانات، ومشاركتها ضمن أطروحاتهمhttps://datascience.nih.gov/researcher-auth-service-initiative

، وستتيح للباحثين تخصيص جزءٍ من الميزانية لتنفيذ هذه المهمة.

وبحسب كارولين هاتر، مديرة قسم علوم الجينوم بالمعهد الوطني لبحوث الجينوم البشري في مدينة بيثيسدا، من المُنتظَر أن تضمن هذه السياسة أن تكون جهود مشاركة البيانات متماشيةً مع الاعتبارات الأخلاقية، واعتبارات الخصوصية، وكذلك مع ما يُعرَف بمبادئ "فير" FAIR، التي تقتضي إتاحة العثور على البيانات، والاطلاع عليها، وإعادة استخدامها، وتوافقها مع البيانات والأدوات الأخرى. وتضيف هاتر: "هذا لا يعني أن ننشر البيانات بأي شكل، وفي أي مكان، على أمل أن يَعثر عليها أحدهم".

وتابعَتْ هاتر قائلة: "الجزء المتعلق بإنفاذ هذه السياسة ليس سهلًا، لأنَّ مشاركة البيانات غالبًا ما تأتي في نهاية المشروع". وكما هو الحال مع محرري الدوريات العلمية، ليس بوسع مديري المنح سوى التحقق عشوائيًّا من أرقام التعريف الخاصة بسجلات مشاركة البيانات في تقارير التقدم السنوية.

بحثًا عن حلول

لا يبعُد أن تكون هناك طُرُق لتعزيز مشاركة البيانات ببساطة، دون انتهاك حقوق الملكية، أو قواعد الخصوصية. والحق أن قِسمًا معتبرًا من المعنيين بعلوم الجينوم يُجْمِعون على أنَّ هناك نوعًا مُجمَّعًا من بيانات دراسات الارتباط يمكن مشاركته على نطاقٍ واسع دون قيود، بل وينبغي مشاركته بهذا الشكل. ويتمثل هذا النوع في تلك البيانات التي تُعرف بالإحصائيات التلخيصية لدراسات الارتباط على مستوى الجينوم. هذه الملخصات تتضمن الدرجات المُجمَّعة لكل متغير جيني اكتُشف ارتباطه بأحد الأمراض في العديد من الجينومات. وهي أسهل في الاستخدام بالنسبة للباحثين، من جهة، وتحمي خصوصية المشاركين، من جهةٍ أخرى.

ثمة اتحادات بحثية عديدة تشارك هذه البيانات بالفعل على مواقعها أو منصَّاتها الإلكترونية. غير أنَّ هناك قاعدة بيانات مفتوحة الوصول تسعى إلى توفير حلٍ موحَّد ومركزي لتلك المشكلة: هي قاعدة فهرس دراسات الارتباط على مستوى الجينوم3 (GWAS Catalog)، التي يتعاون في إنشائها المعهد الأوروبي للمعلوماتية الحيوية، والمعهد الوطني لبحوث الجينوم البشري.

واعتبارًا من عام 2020، وفَّر هذا الفهرس للباحثين وسيلةً لتحميل إحصائياتهم التلخيصية، إلى جانب البيانات الوصفية للدراسات والمشاركين فيها. ونظير ذلك، يحصل الباحثون على رقم تعريف قبل النشر، ليستخدموه في المسودات الأولية التي يقدمونها.

"إذا لم تتوفر لديك البيانات الأولية، فلن يكون بإمكانك التحقق من الجودة".

وفي مقابل ذلك، نجد أن هناك عددًا كبيرًا من الباحثين يرون أنَّ تلك الإحصائيات التلخيصية لا تكفي لتحقيق أي تقدُّم في علوم الجينوم. ومن القائلين بهذا الرأي كريس أموس، الباحث المتخصص في علم الوبائيات الجيني، الذي يدرس سرطان الرئة في كلية بايلور للطب بمدينة هيوستن في ولاية تكساس الأمريكية، إذ يرى أنها "قد تضر بدراسات الارتباط على مستوى الجينوم ضررًا بالغًا"؛ ذلك أنَّ الباحثين يحتاجون إلى البيانات الجينومية الخاصة بالأفراد، وكذا بيانات سمات الأنماط الظاهرية المرتبطة بها، ليكتشفوا بدقة الدور الذي تؤديه التغيرات الجينية في نشوء الأمراض. كما يحتاج الباحثون إلى البيانات كاملةً للتحقق من دقة الأبحاث المُجراة. يقول أموس: "إذا لم تتوفر لديك البيانات الأولية، فلن يكون بإمكانك التحقق من الجودة. والإحصائيات التلخيصية لن تكفي للتوصل إلى نتائج يمكن التحقق منها بتكرارها".

وفضلًا عن ذلك، فإنَّ الجهات التي تملك بيانات مجموعات أتراب ضخمة لا تمنح الباحثين إمكانية الوصول إلى إحصائياتها التلخيصية دون قيود، ومنها شركتا "توينتي ثري آند مي"، و"جينوميكس إنجلاند". تبرر هذه الجهات موقفها بالمخاوف المتعلقة بخصوصية بيانات المشاركين، والرغبة في الاحتفاظ بملكية بياناتهم. وواقع الأمر أنها تدير قواعد بيانات مقيدة الوصول خاصة بها، ولهذه القواعد إجراءات معينة للوصول إلى البيانات وإعادة تحليلها. وأحد الشروط المسبقة التي تضعها هذه الشركات لاستخدام معظم بياناتها هو إدراج اسمها ضمن المؤلفين المشاركين في أي أبحاثٍ أو دراسات تُستخدَم فيها تلك البيانات. وتشير باهلو إلى أنَّ هذه الشروط، وما شابهها، تمثل عقبات شديدة الصعوبة، بالنسبة إليها وغيرها من المتخصصين في مجال المعلوماتية الحيوية، ممَّن يرغبون في تحليل البيانات الخاصة بمشروع "المئة ألف جينوم" التابع لشركة "جينوميكس إنجلاند".

ولا يغيب عن هاتر أنَّ المشكلات المتعلقة بمشاركة البيانات الجينومية باتت من التعقيد والتفاقم بحيث لا يكفي لحلها تحسين قاعدة بيانات الأنماط الجينية والظاهرية، أو مشاركة الإحصائيات التلخيصية للبيانات في قاعدة فهرس دراسات الارتباط على مستوى الجينوم. وتقول: "لم تُصمَّم قاعدة بيانات الأنماط الجينية والظاهرية على نحوٍ يجعلها مؤهَّلة للتطوُّر والتعامل مع كل نوعٍ جديد من البيانات". فعلى سبيل المثال، تختلف كلفة تخزين بيانات الجينومات الكاملة اختلافًا جذريًّا عن كلفة تخزين بيانات دراسات الارتباط. ومن هذا المنطلَق، أسس المعهد الوطني لبحوث الجينوم البشري منظومةً سحابية، أُطلِق عليها "المساحة المخبرية للتحليل والتمثيل ونُظُم المعلومات"، ويُشار إليها اختصارًا بمنظومة "أنفيل" AnVIL، وهي تتيح للباحثين تبادُل مجموعات ضخمة من البيانات الجينومية، وتحليلها، ومن بينها بياناتٌ خاصة بتسلسلات الجينومات الكاملة، وأخرى خاصة بالتسلسلات الإكسومية.

وإضافةً إلى ما تَقدَّم، أطلقت معاهد الصحة الوطنية الأمريكية مبادرةً أخرى، تتمثل في "خدمة تصاريح الباحثين" RAS، التي ستمنحهم إمكانية استخدام المنصة السحابية سالفة الذكر، وقاعدة بيانات الأنماط الجينية والظاهرية، ومصادر بيانات أخرى عديدة. ويقول شيري عن ذلك: "رؤيتنا هي أن تكون لدينا خدمة أشبه بختم التأشيرة"، مما سيتيح للباحثين في النهاية دمج البيانات وتحليلها كما يحلو لهم في الأنظمة السحابية. وأضاف شيري: "إننا عاكفون على إنشاء واحدة من أُولَيات منظومات بطاقات العضوية للباحثين".

أمَّا هاوسلر، ومعه عددٌ ممن يعملون في تهيئة البيانات الضخمة، فلديهم أفكارهم أيضًا. فمع تأجُّج مشاعر الإحباط حيال مشكلة مشاركة البيانات في عام 2013، تعاوَن هاوسلر مع ديفيد ألتشولر، وإيريك لاندر، وزملاء آخرين من بلدان متعددة، لوضع أسس ما يُعرَف بالتحالف العالمي لعلوم الجينوم والصحة (GA4GH)، الذي يقوم على نفس المُثُل التي قام عليها مشروع الجينوم البشري. يقول هاوسلر: "كنا عازمين على إقناع الجميع بمشاركة البيانات في قاعدةٍ واحدة كبيرة، والاتفاق فيما بيننا على آلية استخدام البيانات، وبذا، تتضافر الجهود. لكن سرعان ما تبدَّى لنا أنَّ هذا مما يتعذَّر تحقيقه على أرض الواقع".

وعوضًا عن ذلك، يركز التحالف العالمي الآن على وضع بروتوكولات لذلك العدد الهائل من قواعد البيانات الجينومية حول العالم. وينطلق من فرضية جوهرية مفادُها أنَّ في الإمكان تحقيق التوافق بين البيانات من الناحية التقنية (كما في فهرس دراسات الارتباط على مستوى الجينوم، ولكن على نطاقٍ أوسع)، وإنشاء منظومةٍ مركزية تجمع مستودعات البيانات المختلفة، أو ربطها معًا بنظامٍ يتسم بالمرونة.

يرى المسؤول التنفيذي للتحالف، بيتر جودهاند، أنَّ هذا النظام أشبه ما يكون بمنظومة الاتصالات العالمية للهواتف النقَّالة. صحيحٌ أنَّ المنافسة محتدمة بين شركات الهواتف النقَّالة، ومقدمي خدمات الاتصالات، إلا أن الطرفين، في نهاية المطاف، ملتزمان بالعمل معًا على الشبكة نفسها. ويقول جودهاند موضحًا: "لكي يتحقق التوافق التشغيلي حقًّا، ينبغي أن يكون هناك مستوى من التعاون في العمل بين مقدمي الخدمات. وبالمثل، يمكننا إعداد الأنظمة التي تتيح مشاركة البيانات، وتيسِّر الإجراءات اللازمة لتحقيق ذلك".

وقد استعان بعض العلماء بأحد البروتوكولات التي وضعها التحالف لتأسيس خدمة "ماتش مايكر إكستشنج" Matchmaker Exchange، التي تتيح للباحثين والأطبَّاء الإكلينيكيين، المتخصِّصين في علاج الأمراض شديدة الندرة، أن يبحثوا في شبكةٍ مركزية واحدة تجمع ثماني قواعد بيانات عالمية، ليعثروا على أصحاب الأنماط الجينية أو الظاهرية المشابهة للحالات التي يعكفون على دراستها. وإذا بيَّنت عملية البحث وجود تطابق، يُتاح للطرفين الاتصال ببعضهما، على نحوٍ يحمي سرية معلومات المريض، ويحمي كذلك ملكية الأبحاث وحقوق تأليف أوراقها. وقد وضع التحالف بروتوكولًا آخر، تعتزم مبادرة "خدمة تصاريح الباحثين"، التابعة لوكالة معاهد الصحة الوطنية الأمريكية، الاعتماد عليه. يُطلَق على هذا البروتوكول اسم "خدمة مستودع البيانات"، وهو واجهةٍ برمجية تُسَهِّل التواصل بين مستودعات البيانات المختلفة.

وترى باهلو، ضِمْن آخرين، أنَّ هذه الجهود الرامية إلى جمع قواعد البيانات في منظومةٍ مركزية تزداد أهميتها حين نأخذ بعين الاعتبار توجه المجال إلى التعمق في دراسة بيانات الأنماط الظاهرية، التي اتسع نطاقها، وازداد تعقيدها. وأضافت باهلو: "تأتي هذه البيانات في جميع الصور والأشكال؛ منها التعرض للعوامل البيئية، والموقف من عادة التدخين، وبيانات التصوير الطبي، وغيرها".

كما ترى باهلو، ومعها آخرون، أنَّ هذه الجهود تمثل فرصةً واعدةً لتحقيق العدالة في مشاركة البيانات الجينومية على الصعيد العالمي؛ إذ إنها تتيح لباحثي الدول النامية الوصول إلى مجموعات البيانات، والاستفادة منها، دونما حاجة إلى إنتاج بياناتهم الخاصة، أو اقتناء إمكانات حوسبية فائقة. وبالإضافة إلى هذا، فلو تحسنت عمليات مشاركة البيانات، سوف يُترجَم ذلك إلى تعزيز التمثيل الجينومي لذوي الأصول الإثنية الأخرى، بخلاف البيض وغير الأوروبيين. ومن المعلوم أن مشكلة ضعف التمثيل تتجلَّى بصفةٍ خاصة في حالة الجماعات السكانية من الأصول الأفريقية، التي تقل نسبة تمثيلها عن 0.5% من جميع المشاركين في دراسات الارتباط على مستوى الجينوم4.

ويعتقد هاوسلر أنَّ العلماء سوف يقتنعون بمشاركة بياناتهم بطرقٍ أفضل، إذا مارَس عليهم أقرانهم بعض الضغط الإيجابي. فحاجتنا إلى هذه المشاركات تزداد حتمًا بمرور الوقت؛ وليس أدلَّ على ذلك من أنَّ فريقه، بعد انقضاء عشرين عامًا على نشر أول جينوم بشري على الإنترنت، قد صمَّم أداةً تمكِّن أي شخصٍ من الاطلاع على جينوم فيروس "سارس-كوف-2"5.

وأضاف هاوسلر: "ينبغي أن تكون البيانات أشبه شيءٍ بالكائنات الحية: يمكن التعامل معها فور النقر عليها. وينبغي أن يكون هذا دافعنا؛ فإذا لم تشارِك بياناتك مع الجميع، لن يتسنى لك الحصول على بيانات الآخرين".

References

  1. International Human Genome Sequencing Consortium. Nature 409, 860–921 (2001). | article
  2. Chong, J. X. et al. Am. J. Hum. Genet. 97, 199–215 (2015). | article
  3. Buniello, A. et al. Nucl. Acids Res. 47, D1005–D1012 (2019). | article
  4. Mills, M. C. & Rahal, C. Commun. Biol. 2, 9 (2019). | article
  5. Fernandes, J. D. et al. Nature Genet. 52, 991–998 (2020). | article

كيندال باول

صحفية علمية حرة، مُقيمة في مدينة لافاييت بولاية كولورادو الأمريكية.