أنباء وآراء

علم الجينوم: مشروعٌ بحثي ضخم يعزز قدرتنا على فهم الجينومات

من خلال جهودٍ هائلة لتحديد التسلسلات الجينومية وتحليلها، أنتج باحثون مجموعات بيانات وأدوات هي الأكثر شمولًا حتى الآن من حيث ما تتيحه من فهم للتنوع الجيني لدى البشر. وسيكون مَورِد البيانات الذي أسفرت عنه جهود هؤلاء الباحثين مفيدًا للغاية لمتخصصي البيولوجيا على اختلافاتهم.

ديانا إم. تشيرش
  • Published online:

كيف تؤثر الاختلافات في الشفرة الجينية بين شخصٍ وآخر على نموّنا وصحتنا كأفراد؟ لم يتمكن الباحثون حتى الآن من الإجابة عن هذا السؤال، بسبب عدة عوامل، أولها: أنَّ فهم التنوع الجيني يتطلب تحليل أعدادٍ هائلة من التسلسلات الجينية، لأنَّنا كبشر نحمل كثيرًا من التغيرات الجينية النادرة1. ومعظم هذه التغيرات ليس له أي تأثير، بينما يسبب عددٌ قليل فقط من هذه التغيرات أمراضًا جينية. وثاني تلك العوامل هو أنَّ معظم ما نفهمه عن التنوع الجيني لدى البشر جرى استقاؤه من دراسة تغيرات النيوكليوتيدات المفردة (SNVs)، لكنَّ التغيرات البنيوية، التي يزيد طولها عن 50 نيوكليوتيدًا، يمكن أن يكون لها تأثيرٌ أكبر على السمات الفسيولوجية، وتُعَد من العوامل الرئيسة المسببة للأمراض2. أما العامل الثالث الذي يعرقل الإجابة عن هذا السؤال، فهو عدم فهْمنا للتغيرات الجينية خارج التسلسلات المُرمِّزة للبروتينات، لكنْ في أربع ورقاتٍ بحثية نُشرت مؤخرًا في دورية Nature، حاول الاتحاد القائم على مشروع قاعدة بيانات تجميع الجينوم3-6 (gnomAD) سدّ هذه الفجوات المعرفية.

يأتي هذا المشروع خلفًا لمشروع اتحاد تجميع الإكسوم7 (ExAC)، الذي كان له تأثيرٌ كبير في مجاله، ووَضَع دليلًا للاختلافات الجينية في الأجزاء المرمِّزة للبروتينات بالجينوم (الإكسومات) لدى أكثر من 60 ألف شخص (الشكل 1). وقد حقق ذلك المشروع الأول نجاحًا غير مسبوق على صعيد التحليلات المتسقة التي أجراها على البيانات -إذ جمع بياناتٍ من مشروعاتٍ متنوعة، لإعادة تحليلها في سلسلة معالجة مشتركة- وكذلك على صعيد مشاركة البيانات، إذ أُتيحت بياناته للعلماء قبل وقتٍ طويل من نشر أبحاثه في عام 2016، وكان لها تأثيرٌ عميق على الكيفية التي يفسر بها الباحثون والأطباء واستشاريو الأمراض الجينية الخصائص الجينومية لدى المصابين بالأمراض الجينية.

في الورقة البحثية الأولى لمشروع قاعدة بيانات تجميع الجينوم، يصف الباحث كونراد كارشفسكي وزملاؤه3 مجموعة بيانات المشروع، التي تتكون من 125,748 إكسومًا، و15,708 جينومات كاملة. وما يثير الاهتمام بالأخص هو اتجاه المشروع إلى تحديد تسلسلات الجينومات الكاملة، لأنَّ تحليل التسلسلات غير المرمزة للبروتينات يوفر معلوماتٍ حول كلٍّ من التغيرات البنيوية، وصور التنوع في تسلسلات الحمض النووي التي تنظم التعبير الجيني، وهي المعلومات التي تتناولها الأوراق البحثية المرفقة مع المشروع. ويتضمن مورِد المشروع تسلسلاتٍ جينومية تخص أشخاصًا من مجموعاتٍ سكانية متنوعة، منهم أفرادٌ من آسيا، وأفريقيا، لكنّ المؤلفين يشيرون إلى أنَّه ما زالت هناك حاجة إلى عيناتٍ ممثلة لمجموعاتٍ سكانية أكثر تنوعًا، لكشف المدى الكامل للتنوع الجيني البشري، وتوصيف مزيدٍ من التغيرات الجينية الخاصة بمجموعاتٍ سكانية بعينها.

"التأثير العلمي الذي سينتج عن هذا المشروع يتجاوز بكثير تأثير مجموعة أبحاثه الحالية".

بعد ذلك، يحلل كارشفسكي وزملاؤه التغيرات الجينية المرمِّزة للبروتينات في مجموعة بياناتهم. ويستندون في هذا إلى مقياسٍ وضعته المجموعة التي قامت على مشروع تجميع الإكسوم، لتقييم ما إذا كان جينٌ ما يمكنه "تحمُّل" التغيرات التي من المتوقع أن تمنع الوظائف الطبيعية للبروتين الذي يرمزه هذا الجين، أي بعبارةٍ أخرى.. ما إذا كانت تلك التغيرات، المعروفة اختصارًا باسم (pLoF)، لها تأثيرٌ بسيط أو منعدم على الحالة الفسيولوجية للإنسان، أم أنَّها تسبب مشكلاتٍ صحية خطيرة، أو تؤدي إلى الوفاة. وهذا النوع من التحليلات مفيد، لأنَّ الجينات التي تعجز عن تحمُّل فقدان وظيفة ما ترمزه من بروتينات قد تكون ضروريةً للحياة، أو قد تتسبب طفراتها في الإصابة بأمراضٍ جينية.

وفي كل جينٍ، يقيس ذلك المقياس الذي وضعته المجموعة العدد المرصود من التغيرات المعوِّقة للوظائف الطبيعية للبروتين على مستوى كل مجموعةٍ سكانية، ويقارنه بالعدد المتوقع من تلك التغيرات بالنظر إلى معدل نشوء الطفرات في الجينومات على مدار عملية التطور، لكنْ نظرًا إلى أنَّ تلك التغيرات شديدة الندرة، لم يكن عدد الإكسومات التي تناولها مشروع تجميع الأكسوم (60 ألف إكسوم) كافيًا للقَطْع بما إذا كانت الجينات المدروسة كلها -لا سيما الجينات الصغيرة- عاجزة عن تحمُّل تلك التغيرات، أم لا. ولهذا.. عُبِّر عن البيانات في صورة احتمالية تحمُّل جينٍ معين لوجود هذه التغيرات.

وعلى النقيض من ذلك.. يسمح الحجم الأكبر للمجموعات السكانية المشترِكة في سمات بعينها في مشروع قاعدة بيانات تجميع الجينوم بقياس مدى تحمُّل الجينات لفقدان وظائف بروتيناتها على نحوٍ أكثر دقة. وقد قسَّم كارشفسكي وزملاؤه الجينات إلى عشر مجموعات، وفقًا لمدى تكرار احتوائها على تغيراتٍ مسببة لفقدان وظيفة بروتيناتها، مقارنةً بالعدد المتوقع من هذه التغيرات، وأنتجوا بهذا طيفًا لمدى تحمُّل الجينات لتلك التغيرات. ويعني الحجم الأكبر للعينة أنَّ طول الجين لا يُعَد مشكلةً كبيرة في تحليلات المشروع، ومع ذلك.. لم يتمكن المؤلفون من وضع تقييمٍ دقيق لمدى تكرار ذلك النوع من التغيرات في الجينات التي كان من المتوقع أن تحتوي على عددٍ قليل منها، والتي تبلغ نسبتها 30%.

ورغم ذلك القيد.. يستخدم الفريق البحثي نهجه هذا للحصول على معلوماتٍ جديدة عن الأسس الجينية للأمراض. فعلى سبيل المثال.. وجد المؤلفون أنَّ التغيراتٌ النادرة في الجينات العاجزة عن تحمل فقدان وظيفة بروتيناتها تحدث بشكل أكثر تكرارًا في المصابين بإعاقات ذهنية، وباضطراب طيف التوحد، عنها في غيرهم. وقد تساعد هذه البيانات الباحثين على فهم البنية الجينية المعقدة المسببة لهذه السمات.

الشكل 1 | فهرسة التنوع الجيني لدى البشر. (أ): في عام 2016، وضع مشروع اتحاد تجميع الإكسوم دليلًا للمواقع الموجودة في التسلسلات المرمزة للبروتينات (الإكسومات) بالجينوم البشري، التي يمكن أن تختلف فيها النيوكليوتيدات المفردة بين كل شخصٍ وغيره7. وتكونت قاعدة البيانات من إكسوماتٍ مأخوذة من 60,708 أشخاص. (ب): يأتي خلفًا لهذا المشروع مشروع آخر، يُعرف باسم مشروع قاعدة بيانات تجميع الجينوم، ويتضمن 15,708 تسلسلات جينومات كاملة، بالإضافة إلى 125,748 إكسومًا3-6. ولم يضع هذا المشروع الأخير دليلًا لتغيرات النيوكليوتيدات المفردة (SNVs) عبر الجينومات بأكملها فحسب، بل أيضًا التغيرات البنيوية الأكثر تعقيدًا، التي تتضمن 50 نيوكليوتيدًا، أو أكثر. وقد تشمل تلك التغيرات تغيرات حذف الحمض النووي، أو انقلابه، أو تكراره.

الشكل 1 | فهرسة التنوع الجيني لدى البشر. (أ): في عام 2016، وضع مشروع اتحاد تجميع الإكسوم دليلًا للمواقع الموجودة في التسلسلات المرمزة للبروتينات (الإكسومات) بالجينوم البشري، التي يمكن أن تختلف فيها النيوكليوتيدات المفردة بين كل شخصٍ وغيره7. وتكونت قاعدة البيانات من إكسوماتٍ مأخوذة من 60,708 أشخاص. (ب): يأتي خلفًا لهذا المشروع مشروع آخر، يُعرف باسم مشروع قاعدة بيانات تجميع الجينوم، ويتضمن 15,708 تسلسلات جينومات كاملة، بالإضافة إلى 125,748 إكسومًا3-6. ولم يضع هذا المشروع الأخير دليلًا لتغيرات النيوكليوتيدات المفردة (SNVs) عبر الجينومات بأكملها فحسب، بل أيضًا التغيرات البنيوية الأكثر تعقيدًا، التي تتضمن 50 نيوكليوتيدًا، أو أكثر. وقد تشمل تلك التغيرات تغيرات حذف الحمض النووي، أو انقلابه، أو تكراره.

كبر الصورة

وفي الورقة البحثية الثانية لمشروع قاعدة بيانات تجميع الجينوم، درست الباحثة بيريل كامينجز وزملاؤها4 لماذا يمكن أحيانًا لبعض الجينات، التي تبدو عاجزةً عن تحمُّل التغيرات المسببة لفقدان وظيفة بروتيناتها، أن تحتوي على هذه التغيرات، دون أن يتسبب ذلك إلا في تبعاتٍ بسيطة، حسبما يبدو. فالجينات يمكن نسخها بطرقٍ مختلفة، وبعض المناطق المرمِّزة للبروتينات (الإكسونات) لا يُعبَّر عنها إلا بطريقةٍ محدودة. وقد أوضحت كامينجز وزملاؤها أنَّه عندما يحمل شخصٌ ما تغيرًا من تلك التغيرات في جينٍ عاجز عن التحمل، كثيرًا ما يكون هذا التغير في إكسونٍ يُعبَّر عنه بتلك الطريقة المحدودة، وبهذا.. يُحَد من تأثيره.

أما في الورقة الثالثة، فقد قيَّم الباحث إريك مينيكل وزملاؤه5 كيف يمكن لقاعدة بيانات التغيرات التي تُفقد البروتينات وظائفها أن تحسِّن قدرتنا على تحديد الأهداف الجينية للعقاقير، إذ إنَّ تحديد الأفراد الذين يحملون تغيرين من هذه التغيرات في جينٍ معين يُعَد منشودًا لاكتشاف العقاقير، وذلك لأنَّه إنْ أبدى هؤلاء الأفراد أيضًا تغيرًا في سمةٍ معينة، فإنَّ ذلك يوفر دليلًا على أنَّ الجين يمكن أن يكون هدفًا جيدًا للأدوية8. وقد أوضح الفريق البحثي أنَّه ما زال هناك الكثير من الأخطاء في عملية تحديد تلك التغيرات الجينية، وأنَّه من الضروري مراقبة جودة تنفيذ تلك العملية. كما أشار إلى أنَّه من النادر للغاية أن يحمل شخصٌ ما تغيرين من تلك التغيرات في الجين نفسه، إلى درجة أنَّنا سنحتاج مجموعات أتراب، حجمها أكبر من مجموعات المشروع بحوالي ألف مرة، حتى نجمع أدلةً حاسمة على وجود تلك التغيرات في معظم الجينات.

وأحد الجوانب الأكثر إثارةً في ذلك المشروع هو الدليل الذي وضعه للتغيرات البنيوية، والذي وُصِفَ في الورقة الأخيرة التي ألفها الباحث ريان كولينز وزملاؤه6، إذ بُذلت فيه جهودٌ ممتازة لفهرسة التغيرات البنيوية، باستخدام تقنية تحديد التسلسلات الجينية عبر القراءات الطويلة9. ومع ذلك.. كانت أحجام العينات المدروسة صغيرة، نظرًا إلى التكلفة، والافتقار إلى سلاسل معالجة معيارية تصلح لهذا النهج، لكنِّي أتوقع تحسُّن هذا الوضع في المستقبل القريب. وعلى النقيض من ذلك، فإنَّ تحديد التغيرات البنيوية من خلال تقنية تحديد التسلسلات عبر القراءات القصيرة صعب من الناحية التقنية، لأنَّ تلك التغيرات كثيرًا ما تكون أكبر من الطول المعتاد لأجزاء التسلسلات التي تقرأها تلك التقنية، كما أنَّها قد تنشأ عبر مجموعةٍ متنوعة من آليات الطفرات، وهو ما يتسبب في وجود أنواعٍ كثيرة من تلك التغيرات (مثل تغيرات تكرار الحمض النووي، أو حذفه، أو انقلابه)، يترك كلٌّ منها بصماتٍ مختلفة في الجينوم. وقد أدى ذلك إلى تطوير عديدٍ من الأدوات، لتحديد التغيرات البنيوية من القراءات القصيرة، لكن لم يكن من بينها سلسلة معالجة "معيارية" مصممة لهذا الغرض.

وقد سعى كولينز وزملاؤه إلى معالجة هذه المشكلة، عن طريق تطوير سلسلة معالجة تسمح بإجراء تحليلاتٍ متسقة على آلاف الجينومات. وقد تصبح تلك السلسلة النموذج الذي تتبعه الصناعة للكشف عن التغيرات البنيوية على مستوى كل مجموعةٍ سكانية، من خلال التسلسلات قصيرة القراءات. وقد وضع مؤلفو الورقة دليلًا يضم أكثر من 300 ألف تغيرٍ بنيوي عالي الجودة، أي أكثر من ضعف ما أنتجته التحليلات السابقة، ثم بدأوا في تقييم مدى إسهام التغيرات البنيوية في السمات الفسيولوجية. وقد كشف هذا التحليل بعض الأدلة على حدوث عملية انتقاءٍ طبيعي تقاوِم التغيرات البنيوية في التسلسلات غير المرمِّزة للبروتينات، التي تتحكم في التعبير الجيني. وكما كان متوقعًا، كانت عملية الانتقاء الطبيعي المقاوِمة للتغيرات البنيوية تحدث بصورة أقوى في المناطق المرمِّزة للبروتينات. ويشير هذا إلى قدرة الجينات على تحمُّل مزيدٍ من التغيرات في المناطق غير المرمِّزة للبروتينات، مقارنةً بغيرها، وإلى أنَّنا سنحتاج إلى مجموعات أتراب أكبر حجمًا من ذلك (أو طرقٍ أخرى)، لنبدأ في تحليل التغيرات في المناطق غير المرمزة للبروتينات على نحوٍ أكثر إحكامًا. وقد وجد الباحثون أيضًا أنَّ التغيرات البنيوية مسؤولة عن حوالي ربع الأحداث القاطعة للبروتينات.

هذا التحليل الروتيني للتغيرات البنيوية -إلى جانب تحليل تغيرات النيوكليوتيدات المفردة والتعبير الجيني- سيكون بالغ الأهمية لتفسير خصائص الجينومات المفردة. وقد حقق كولينز وزملاؤه خطوةً مهمة في هذا الصدد. ويوفر مَورِد قاعدة بيانات تجميع الجينوم أدواتٍ لمساعدة الباحثين الآخرين على الاستمرار في هذا المسار.

الفكرة المتكررة والمثيرة للاهتمام في هذه الأوراق البحثية هو أنَّنا -رغم حجم مجموعات الأتراب المدروسة- ما زلنا نفتقر إلى الأرقام اللازمة لإجراء عديدٍ من التحليلات. ولهذا.. ينبغي -بلا شك- الاستمرار في تحديد تسلسلات جينومات مجموعاتٍ أكبر من الأتراب، لكنَّ هذا النهج وحده لن يتيح لنا أن نفهم -بصورة تامة- العلاقات بين الجينات البشرية والسمات على مستويَي الخلايا، والكائنات الحية. فنحن بحاجة إلى مقاربات قابلة للتوسع، لوضع مخطط للاختلافات الجينية في صورة خلايا بشرية، وسمات خلوية مُوصَّفة بوضوح، يمكن متابعتها، لنستطيع دراسة التأثير الفسيولوجي لتلك الاختلافات مباشرةً. وهذا النهج البيولوجي التدخلي سيعزز علم الوراثة السكانية بدرجةٍ كبيرة، ويسرع فهْمنا لبيولوجيا البشر.

وقد أتاح اتحاد قاعدة بيانات تجميع الجينوم بياناته للجمهور بالفعل. والتأثير العلمي الذي سينتج عن هذا المشروع يتجاوز –بكثير- تأثير مجموعة أبحاثه الحالية، التي لا تتضمن فقط الأوراق البحثية المنشورة مؤخرًا في دورية Nature، بل تشمل أيضًا مجموعةً من الأوراق الأخرى، نُشرت في دورياتها الشقيقة (go.nature.com/2zgfxr2). وهذا المشروع، شأنه شأن مشروع اتحاد تجميع الإكسوم السابق له، سيغير طريقة تفسيرنا لخصائص الجينومات المفردة. فقد كشفت أبحاثه كَمّ المعلومات التي كنا نجهلها عن التنوع الجيني لدى البشر، ووفرت أدواتٍ ستساعدنا على فهم الجينومات على نحوٍ أفضل، على كلٍّ من مستوى الأفراد، ومستوى المجموعات السكانية. وإنني لأتطلع بشوق بالغ إلى ما يحمله لنا المستقبل في هذا الصدد.

References

  1. Auton, A. et al. Nature 526, 68–74 (2015) | article
  2. Chiang, C. et al. Nature Genet. 49, 692–699 (2017) | article
  3. Karczewski, K. J. et al. Nature 581, 434–443 (2020) | article
  4. Cummings, B. B. et al. Nature 581, 452–458 (2020) | article
  5. Minikel, E. V. et al. Nature 581, 459–464 (2020) | article
  6. Collins, R. L. et al. Nature 581, 444–451 (2020) | article
  7. Lek, M. et al. Nature 536, 285–291 (2016) | article
  8. Plenge, R. M., Scolnick, E. M. & Altshuler, D. Nature Rev. Drug Discov. 12, 581–594 (2013) | article
  9. Chaisson, M. J. P. et al. Nature Commun. 10, 1784 (2019) | article

ديانا إم. تشيرش تعمل في شركة «إنسكريبتا» Inscripta بمدينة بولدر، 80301 كولورادو، الولايات المتحدة الأمريكية.

البريد الإلكتروني: deanna.church@inscripta.com