رؤية كونية

لا مزيد من حلول نُظُم المعلومات الحيوية الغامضة

يقول مونو فيهينن إنه لا يمكن للطب الدقيق أن يتقدم إلا بالاطلاع الكامل على كيفية عمل البرامج التجارية المتخصصة في تحليل تسلسل الجينوم وتفسيره.

مونو فيهينن
  • Published online:

أصبحت كاليفورنيا خلال إبريل الماضي هي الأخيرة في سلسلة المدن التي أطلقت مشروعات "الطب الدقيق"، بهدف تطوير أدوات تشخيصية وعلاجات تقوم على بيانات الجينوم الفردية. وقد أدَّى التطور الذي حدث في تكنولوجيا تحليل التسلسل إلى أنْ أصبحت تكلفة تحديد تسلسل الجينوم بألف دولار أمريكي واقعًا ملموسًا.

أصبح الحصول على بيانات الجينوم أمرًا يسيرًا نسبيًّا، ولكن تحليل هذه البيانات ليس كذلك، فلِكَيْ يؤدي الطب الدقيق دوره، نحتاج إلى التعرف على الفروق الجينية بين الأفراد، ثم نستنبط أيًّا مِن متغيرات هذه الفروق له دور في حدوث المرض.

إنّ الجينومات البشرية متشابهة للغاية، ولكن الاختلاف فيما بينها ـ الذي يُقدَّر بنسبة %0.1 ـ يجعل هناك ملايين الفروق بين الأفراد. وغالبية هذه الفروق تأثيرها ضئيل، أو ليس لها أثر على الإطلاق، ولكن عملية اكتشاف ما إذا كان انحراف جينوم ما عن الجينوم المرجعي انحرافًا مهمًّا، أم مؤثرًا، أم ليس كذلك، واكتشاف درجة هذه الأهمية، هي عملية معقدة ومستنزِفة للوقت، حتى إنها أصبحت تمثل عنق الزجاجة في عمل الطب الدقيق.

أما عن تحديد الروابط التي تصل بين المتغيرات الجينية والمرض، فذلك يقع ـ إلى حد كبير ـ في نطاق عمل نُظُم المعلومات الحيوية. كان الأكاديميون في الأساس يصممون برامج الكمبيوتر المُستخدَمة في عمل هذه الروابط بأنفسهم، ويتبادلونها فيما بينهم، ولكن مع الطفرة التي حدثت في إنتاج البيانات الجينومية، بدأت الشركات التجارية في عرض برامج خاصة بها؛ وتزايدت هذه العروض. فهذا السوق متزايد النمو، ومتاح أمام كل مَنْ يحضر مؤتمرات عِلْم الوراثة الكبرى، فمنذ ثلاث أو أربع سنوات كانت هناك شركات تُعَدّ على أصابع اليد هي فقط التي تَعرِض مثل هذه البرامج، أما الآن، فأصبح هناك عشرات الشركات.

كما أن الحِزَم التجارية لتكنولوجيا نُظُم المعلومات الحيوية مغرية بصورة واضحة، فهي سهلة الاستعمال، وتتمتع بواجهات مصمَّمة تصميمًا بارعًا، يسمح حتى لغير الخبراء بمعالجة معلومات معقدة عن تحليل التسلسل الجينومي. وبعض هذه البرامج التجارية يُجرِي العملية كاملة بمراحلها بسلاسة فائقة، بدءًا من التسلسل، حتى تحليل وتفسير البيانات، كما تضمن هذه الشركات توفير الدعم الفني، الذي لا يتوافر عادةً في البرامج مفتوحة المصدر.

ومع ذلك.. هناك مشكلة كبرى.. فعادةً ما ترفض هذه الشركات الكشف عن كيفية عمل برامجها، فهي لا تريد الإعلان عن المناهج والبيانات المُستخدمة لبناء خوارزميات، أو تفاصيل أدائها، ومن ثم فمن المستحيل أن تفحص البرامج من حيث جودتها، وتقارن بين بعضها البعض. وجدير بالذكر أن التفاصيل مهمة فعلًا بالنسبة إلى مثل هذه الأدوات، فيجب ربط المقاطع القصيرة من التسلسل (القراءات)، لبناء الجينومات الكاملة. وهذه الطريقة صعبة، ومناهج التسلسل السريعة تنطوي على نسبة خطأ كبيرة، يجب أخذها في الحسبان عندما يحدِّد البرنامج مُتغيرات محتملة. وكلما زادت القراءات المتشابكة التي يحتويها مشروع التسلسل؛ كانت النتائج أفضل، وعادة ما تكون التغطية بالعشرات، ولكن في التسلسل العميق قد تصل إلى آلاف.

يجب أن تقوم الأبحاث على الوضوح والمعرفة الكاملة للأدوات المُستخدَمة.

وبمجرد تحديد المتغيرات المحتملة، تُستخدَم مجموعة مختلفة من التقنيات؛ لترشيحها وترتيبها، ثم بعد ذلك تُدَوَّن العلاقة الإكلينيكية المُحتملة المقترحة. هذا.. ولا توجد طريقة واحدة صحيحة لفعل ذلك، فقد كونت مجموعات أكاديمية عديدة أدوات مختلفة، تؤدي جميعها هذه الوظائف، مع اختلافات طفيفة فيما بينها. ولذلك.. فالنتائج وحدها ـ المتغيرات وعلاقتها بالمرض ـ ليست كافية للحكم على العلاقة الإكلينيكية، فيجب أن نعرف كيف حصلنا على النتيجة، وكيف تمت معالجة وتحليل البيانات الأوّلية.

الأكاديميون صرحاء في هذا الأمر، ويُسعدهم عرض أعمالهم، مما يمكِّننا من عقد المقارنات. فقد نُشرت دراسات عديدة قارنت بين أداء عدد من مناهج معالجة البيانات، ومجموعات بيانات قياسية مستقلة. وهذه الدراسات تسمح للمُستخدِم النهائي باختيار أكثر الأدوات ملاءمةً، وبأن يُكَوِّن فكرة عن مدى جدارتها بالاعتماد عليها. وينبغي تضمين هذه المعلومات عند نشر البيانات، ولا سيما إذا كانت لهذه المعلومات علاقة إكلينيكية مباشرة، ومن ثم تطلب دورية "هيومان ميوتيشن" Human Mutation ذلك من الدراسات التي تَستخدِم هذه الأدوات وتطوِّرها.

ومن المستحيل في وقتنا الحالي أن نفحص أداء البرامج التجارية بهذه الطريقة، فلقد طلبتُ من الشركات أن تمدّني بالبيانات اللازمة لذلك، ولكنها رفضت، حيث تدعي كل من هذه الشركات أن طريقتها هي الأفضل، ولكنها لا تعطي عميلها أي طريقة للتأكد من ذلك. وكلما نما السوق، وزادت هذه الحزم التجارية ـ القائم أغلبها لسخرية القدر على برامج أكاديمية مفتوحة المصدر ـ زاد حجم المشكلة بالتبعية.

وطريقة حل هذه المشكلة هي أن نضع كل هذه البرامج التجارية المختلفة تحت الاختبار، ونقارن نتائجها بنتائج قياسية مؤكدة، تمت تجربتها مسبقًا (ونعني بهذا.. مجموعات بيانات، نتائجها بمثابة متغيرات معروفة)، ولكنْ حتى لو كنتُ سأشتري ترخيصًا لاستخدام كل هذه البرامج، وهي ليست زهيدة الثمن؛ فلن أتمكّن أيضًا من عقد المقارنة، فغالبًا ما تُطوَّر الخوارزميات التي تقوم عليها هذه البرامج باستخدام مجموعات البيانات نفسها. وبالتالي، لِكَي نُجرِي اختبارات عادلة.. نحتاج إلى معرفة كيفية تدريب الخوارزميات؛ حتى نتلافى استخدام المتغيرات نفسها في كل من التدريب والاختبار، ولكن الشركات لا تريد الكشف عن هذه المعلومات.

تريد الشركات من المُستخدِم أن يقبل الحلول التي تقدمها له في "صندوق أسود مغلق"، دون معرفة أي شيء عن الخوارزميات، وتفاصيل تدريبها، ومجموعات البيانات المُستخدَمة، وطريقة تطبيق المعالجة، واستخدام بيانات قياسية مؤكَّدة مسبقًا. إنّ هذا غير مقبول، حيث يجب أن تقوم الأبحاث على الوضوح، والمعرفة الكاملة للأدوات المُستخدَمة.

ويجب أن يكون الطب الدقيق مستندًا إلى أدلة. والطب المستنِد إلى الأدلة هو اسم على مسمَّى. إنني بالطبع أتفهَّم أن الشركات تحتاج إلى الاحتفاظ ببعض الأسرار التجارية، ولكن الكشف عن المعلومات التي نحن بصددها الآن لا ينطوي على مخاطرة خسارة الشركات لمكانتها أمام منافسيها. ونحن كمتخصصين في هذا المجال.. يجب أن نشترط الحصول على هذه التفاصيل من الشركات، إذا كانت ترغب في بيع منتجاتها وخدماتها لنا.