أنباء وآراء

جينوم السرطان: الكيف وليس الكمّ عند البحث عن الطفرات المُسبِّبة للسرطان 

تحليلٌ تناوَل 360 جينومًا من جينومات سرطان الثدي يكشف عن طفرات مُسبِّبة للسرطان في 9 تسلسلات للأحماض النووية غير المُرمِّزة، المسماة بـ"الحاثَّات" التي تتولى تنظيم التعبير الجيني. وتشير النتائج إلى شيوع المُسبِّبات غير المُرمِّزة.

سوشانت كومار، ومارك جيرستاين

  • Published online:

يحتوي الجينوم المعتاد للسرطان على آلاف الطفرات، التي تحدث الأغلبية الساحقة منها في تسلسلات غير مُرمِّزة للبروتينات، ولكنها - مع ذلك - يمكن أن تؤثر على التعبير الجيني. إلا أن النماذج الكلاسيكية من تطور الأورام تَفترِض أن تطور مرض السرطان يسبِّبه عدد قليل من تلك الطفرات فحسب، التي تخضع لعملية انتخاب إيجابي قوي، ومن ثم، تحافظ عليها تجمعات الخلايا السرطانية بشكل تفضيلي. وإضافة إلى ذلك، يقع معظم الطفرات المُسبِّبة المعروفة في تسلسلات مُرمِّزة2،1، مما يثير تساؤلًا عن عدد المُسبِّبات التي تتوارى في المناطق غير المُرمِّزة. يغزو راينبي وزملاؤه3 هذا المجال في العدد 547 من دورية Nature الدولية.

يمثل التعرف على المُسبِّبات غير المُرمِّزة تحديًّا، نتيجة لضخامة حجم الجينوم، وصعوبة التحديد الدقيق لموقع العناصر غير المُرمِّزة، التي قد تحتوي على مُسبِّبات، حيث يمكن أن تكون تلك العناصر مناطق تنظيمية، مثل الحاثَّات (promotors)، والمُعزِّزات (enhancers) التي تقوم بضبط عملية التعبير الجيني. من الأسهل التعرف على المُسبِّبات في المناطق المُرمِّزة، لأننا نفهم حدود تلك المناطق، وكيف يمكن أن تؤثر الطفرات في تلك المناطق على إنتاج البروتينات ووظيفتها؛ مما قد يسبب السرطان. ورغم ذلك، فإن زيادة التركيز على المُسبِّبات المُرمِّزة - نتيجة لذلك - يمكن أن تخلق نوعًا من التحيز في عملية التعرف على تلك المُسبِّبات. ومن ثم، لا يزال هناك اهتمام بالتعرف على المُسبِّبات غير المُرمِّزة، عن طريق تحليل جينومات سرطان كاملة4. قدمت دراسات السابقة بضعة أمثلة5-7، ولكن لا يزال فهمنا غير مكتمل بالمرة.

شرع راينبي وزملاؤه في تحديد الطفرات المُسبِّبة، المُرمِّزة منها وغير المُرمِّزة، بأسلوب يخلو من التحيز، باستخدام عينات من 360 مصابًا بسرطان الثدي. ولاكتشاف المُسبِّبات غير المُرمِّزة، فتش الباحثون عن الحاثَّات التي تؤوي من الطفرات عددًا يفوق بكثير ما كان متوقَّعًا، أو تلك التي تحتوي على مجموعات من الطفرات، فيما حول مواقع ربط عوامل النسخ (وهي الأماكن المعروفة لربط البروتينات التنظيمية).

وجد المؤلفون مُسبِّبات مفترضة في تسعة حاثَّات، وأوضحوا أن ثلاثًا منها (تلك المرتبطة بالجينات FOXA1، وRMRP، وNEAT1) غيرت مستويات التعبير الجيني بشكل ملحوظ. وأشار تحليل الباحثين للمجموعة الفرعية من الطفرات التي تتكرر لدى كثير من الأفراد أن الطفرات الموجودة في الحاثَّات تتمتع بالدرجة نفسها من الشيوع كتلك التي تتمتع بها الطفرات الموجودة في الجينات المُرمِّزة للبروتينات. وإضافة إلى ذلك، وجد المؤلفون أن معدل الطفرات لكل قاعدة في الحاثَّات التي تحتوي على مُسبِّبات للمرض كان مماثلًا للمعدل نفسه في المناطق المُرمِّزة التي تأوي مُسبِّبات. يشير ذلك إلى أن عدد المُسبِّبات المكتشفة في الحاثَّات كان أقل من تلك التي عُثر عليها في المناطق المُرمِّزة، لأن المنطقة الوظيفية الإجمالية للحاثَّات التي تم استقصاؤها (أي تسلسلات النيوكليوتيدات التي تقف بالفعل وراء النشاط المرتبط بالمرض) كانت أصغر مساحة.

يصف البحث أحدث وسائل التعرف على المُسبِّبات غير المُرمِّزة، ولكن لا يزال مطلوبًا عمل المزيد. وأوضح تحليل القدرة، الذي أجراه المؤلفون (الحسابات الإحصائية التي تُقدِّر أعداد العينات المطلوبة للكشف عن تأثير بحجم معين)، أنه يمكن تحديد أكثر من 90% من المُسبِّبات بشكل موثوق، إذا وُجدت لدى نسبة لا تقل عن 10% من العينات التي تمت دراستها والبالغ عددها 360 عينة، ولكن يتم تحديد 70% فقط من المُسبِّبات في حالة حدوثها لدى 5% من المرضى (الشكل 1). ولِفَهْم التوجيهات الرامية إلى التحسين، يجدر بنا النظر في كيفية تعريف العناصر غير المُرمِّزة، وكيف يدعم ذلك القدرة الإحصائية.

الشكل 1: تحسين اكتشاف الطفرات المُسبِّبة للسرطان في الجينوم غير المُرمِّز

قام راينبي وزملاؤه3 بتحليل جينومات 360 شخصًا مصابًا بمرض سرطان الثدي، وتعرفوا على طفرات مُسبِّبة للسرطان في 9 تسلسلات غير مُرمِّزة، تُسمى "الحاثَّات"، التي تُوجد - على سبيل الاحتمال - في مواقع ربط عوامل النسخ المنظِّمة للتعبير الجيني. أجرى العلماء تحليل قدرة (المنحنى الأصفر)؛ لتحديد النسبة المئوية للزمن المطلوب للتعرف على مُسبِّب موجود لدى 5% من الأشخاص، باستخدام أحجام متباينة للعينات، علما بأن الباحثين قاموا بتحليل 25 ألف تسلسل للحاثَّات، يبلغ طول كل واحد منها 650 زوجًا قاعديًّا. يكشف تحليل القدرة الذي أجراه العلماء أنه عند استخدام عينة حجمها 360 شخصًا، يمكنهم التعرف على 70% من المُسبِّبات الموجودة لدى 5% من الأشخاص (النقطة الصفراء). إذًا، كيف يمكن تحسين القدرة؟ كمثال، إذا تم تحليل 100 ألف حاثّ، فسوف تتناقص القدرة، نتيجة لظاهرة إحصائية تُسمَّى "جزاء الاختبار المتعدد"، (اللون الأحمر). وعلى النقيض من ذلك، سوف يؤدي تحليل حاثَّات بطول 450 زوجًا قاعديًّا إلى زيادة القدرة (اللون الأزرق)، طالما ظلت تلك الحاثَّات تحتوي على مواقع الربط. ويشير ذلك إلى وسيلة للتعرف على المزيد من المُسبِّبات غير المُرمِّزة. و(يُعَدّ المنحنى الأصفر بمثابة مقاربة حسابية لتحليل الباحثين في الشكل 4a في الورقة البحثية3).

قام راينبي وزملاؤه3 بتحليل جينومات 360 شخصًا مصابًا بمرض سرطان الثدي، وتعرفوا على طفرات مُسبِّبة للسرطان في 9 تسلسلات غير مُرمِّزة، تُسمى "الحاثَّات"، التي تُوجد - على سبيل الاحتمال - في مواقع ربط عوامل النسخ المنظِّمة للتعبير الجيني. أجرى العلماء تحليل قدرة (المنحنى الأصفر)؛ لتحديد النسبة المئوية للزمن المطلوب للتعرف على مُسبِّب موجود لدى 5% من الأشخاص، باستخدام أحجام متباينة للعينات، علما بأن الباحثين قاموا بتحليل 25 ألف تسلسل للحاثَّات، يبلغ طول كل واحد منها 650 زوجًا قاعديًّا. يكشف تحليل القدرة الذي أجراه العلماء أنه عند استخدام عينة حجمها 360 شخصًا، يمكنهم التعرف على 70% من المُسبِّبات الموجودة لدى 5% من الأشخاص (النقطة الصفراء). إذًا، كيف يمكن تحسين القدرة؟ كمثال، إذا تم تحليل 100 ألف حاثّ، فسوف تتناقص القدرة، نتيجة لظاهرة إحصائية تُسمَّى "جزاء الاختبار المتعدد"، (اللون الأحمر). وعلى النقيض من ذلك، سوف يؤدي تحليل حاثَّات بطول 450 زوجًا قاعديًّا إلى زيادة القدرة (اللون الأزرق)، طالما ظلت تلك الحاثَّات تحتوي على مواقع الربط. ويشير ذلك إلى وسيلة للتعرف على المزيد من المُسبِّبات غير المُرمِّزة. و(يُعَدّ المنحنى الأصفر بمثابة مقاربة حسابية لتحليل الباحثين في الشكل 4a في الورقة البحثية3).

كبر الصورة

تُعرَّف الكثير من العناصر غير المُرمِّزة (ذات المواقع المحددة) بأنها تسلسلات كبيرة نسبيًّا (يبلغ طولها ما يقرب من كيلو قاعدة واحد). ومع ذلك، يعود ذلك التعريف - بصفة جزئية - إلى أن الأساليب التي نستخدمها في تحديد مواقع تلك العناصر غير دقيقة، حيث تكون منطقتها الوظيفية الحقيقية - في أغلب الأحيان - أصغر بكثير من تلك التي يوردها التعريف. فعلى سبيل المثال، يتم التعرف على مواقع ربط عوامل النسخ عن طريق عزل مركّبات الحمض النووي والبروتينات، ووضع تسلسل لذلك الحمض النووي. كذلك غالبًا ما تُعزَل التسلسلات الأطول من موقع الربط، وعندما تتضمن التجربة خلايا كثيرة، يمكن أن تكون النتيجة "مشوشة". وبالتالي، يمكن تعريف المناطق التي يبلغ طولها كيلو قاعدة واحدًا بأنها مواقع ربط عندما يُحتمل أن يكون طول الموقع الوظيفي الفعلي عشرات النيوكليوتيدات فقط. لذا، يمكن أن يُضعِف تحليل الطفرات متكررة الحدوث عبر المناطق كبيرة الحجم من المؤشر الحقيقي للانتخاب الإيجابي، ويعرقل عملية التعرف على المُسبِّبات.

من بين المنهجيات المستخدَمة في وضع تعريف أفضل للمناطق الوظيفية، نهج التعرف على المناطق المحفوظة تطوريًّا، التي من المرجح أن تكون لها أهمية وظيفية. وإضافة إلى ذلك، فإن العناصر غير المُرمِّزة، مثل الجينات، غالبًا ما تتكون من كتل متقطعة من المناطق الوظيفية. كذلك يُعد الربط بين تلك الكتل وتخطي المناطق غير الوظيفية بمثابة وسيلة أخرى لمضاعفة فرص التعرف على المُسبِّبات، ولكن كيفية الربط بين العناصر غير المُرمِّزة ليست مفهومة بشكل جيد، مقارنة بما يحدث في الجينات (التي تتحد فيها المناطق المُرمِّزة بعد النسخ حول تسلسلات محددة بوضوح، تُسمى "وصلات الربط" splice junctions). وإضافة إلى ذلك، يمكن أن تكون الارتباطات معقدة، بمعنى أن الجينات يمكن ربطها بالعديد من الحاثَّات والمُعزِّزات، ويمكن لمُعزِّز واحد التأثير على الكثير من الجينات.

بعد تعريف المنطقة الوظيفية لعنصر غير مُرمِّز، تصبح الخطوة التالية اختبار العبء الطفري (بمعنى الشيوع النسبي للطفرات في منطقة معينة) على امتداد الكثير من العناصر. فكلما زاد عدد العناصر التي يتم اختبارها، لا بد أن ترتفع نسبة شيوع مُسبِّب معين في تلك العناصر، قبل أن يصبح ممكنًا اعتباره ذا دلالة إحصائية، وذلك نتيجة لمسألة إحصائية تُسمَّى "جزاء الاختبار المتعدد". وهكذا، يمكننا زيادة القدرة على اكتشاف المُسبِّبات، من خلال تقليل حجم مجموعة العناصر، وزيادة دقتها بقدر الإمكان (الشكل 1). يشير ذلك إلى أن الطريقة المثلى لزيادة القدرة للعناصر غير المُرمِّزة هي - ربما على عكس ما هو بديهي - تحليل مجموعة مُعرَّفة بشكل محكم ودقيق للغاية، تحتوي على أقل عدد ممكن من العناصر، بدلًا من دراسة كل قاعدة في الجينوم.

هناك صعوبة أخرى تتمثل في تقييم تأثير الطفرات غير المُرمِّزة، فليس واضحًا ما إذا كان كل تبديل للنيوكليوتيد في منطقة تنظيمية يُسفر عن تأثير متعادل، أم لا. ففي بعض الظروف يمكن التنبؤ بتأثير طفرة ما،وعلى سبيل المثال8، عندما تقطع الطفرة موقع ربط عوامل النسخ، أو تنشئ موقعًا جديدًا. ولكن هناك حاجة إلى مقاييس أفضل للتأثير الوظيفي على امتداد الجينوم بأكمله، إذا أردنا أن نكتشف نظائر غير مُرمِّزة للطفرات المُرمِّزة المعروفة بأنها تُغَيِّر إنتاج البروتين، أو سلوكه. وأخيرًا، تعتمد القدرة على اكتشاف المُسبِّبات في المناطق غير المُرمِّزة على مدى تجانس معدل الطفرات الخلفية الكامنة. وتتميز المعدلات بأنها غير منتظمة عبر مساحات واسعة من الجينوم9، ولذا، فإن المنهجيات الراهنة سوف تتطلب قدرًا إضافيًّا من التحسين.

هناك نهج فعال للتعامل مع بعض تلك التحديات، يتمثل في وضع تسلسل لجينومات الكثير من المرضى. يكون هذا النهج قابلًا للتنفيذ فقط من خلال مشروعات التعاون البحثي واسعة النطاق، إذ سوف تثمر تلك الجهود عن فهارس شاملة للمتغيرات غير المُرمِّزة، التي تمنحنا إحصائيات أفضل، يمكن الاستفادة منها في اكتشاف المزيد من الطفرات المُسبِّبة للمرض. ولكن تلك الدراسات واسعة النطاق تتطلب فئات عمرية متجانسة، وذلك سوف يمثل تحديًا، نظرًا إلى الطبيعة المتباينة بشدة لمرض السرطان. ولذا، يُعَدّ تطوير تعريف وظيفي أكثر دقة للجينوم غير المُرمِّز بديلًا مقنعًا. وفي هذا الإطار، يصير على مجموعات التعريف العلمي - مثل مشروع "إنكود" 10ENCODE - القيام بدور حيوي في ذلك. وأخيرًا، وكما تبيِّن دراسة راينبي وزملائه بدقة، يمكن اكتشاف مزيد من مُسبِّبات السرطان، عن طريق التركيز على مساحة أصغر من الجينوم.

References

  1. The Cancer Genome Atlas Research Network. Nature Genet. 45, 1113–1120 (2013). | article
  2. Tamborero, D. et al. Sci. Rep. 3, 2650 (2013). | article
  3. Rheinbay, E. et al. Nature 547, 55–60 (2017). | article
  4. Khurana, E. et al. Nature Rev. Genet. 17, 93–108 (2016). | article
  5. Vinagre, J. et al. Nature Commun. 4, 2185 (2013). 
  6. Weinhold, N., Jacobsen, A., Schultz, N., Sander, C. & Lee, W. Nature Genet. 46, 1160–1165 (2014). | article
  7. Weischenfeldt, J. et al. Nature Genet. 49, 65–74 (2017). | article
  8. Khurana, E. et al. Science 342, 1235587 (2013). | article
  9. Lochovsky, L., Zhang, J., Fu, Y., Khurana, E. & Gerstein, M. Nucleic Acids Res. 43, 8123–8134 (2015). | article
  10. The ENCODE Project Consortium. Nature 489, 57–74 (2012). | article

سوشانت كومار، ومارك جيرستاين يعملان في برنامج الأحياء الحاسوبية والمعلوماتية الحيوية، وبقسم الفيزياء الحيوية الجزيئية والكيمياء الحيوية، جامعة ييل في نيو هافن، ولاية كونيتيكت 06520، الولايات المتحدة. ويعمل مارك جيرستاين أيضًا في قسم علوم الحاسب، جامعة ييل.

البريد الإلكتروني: mark@gersteinlab.org