أنباء وآراء

عرَّاف آلي يتنبَّأ بتنظيم التعبير الجيني

تُعدُّ القدرة على التنبؤ بالتعبير الجيني من خلال تسلسلات الحمض النووي من الأهداف التي طالما راودت علماء الأحياء. ومؤخرًا، نجحت تقنية للذكاء الاصطناعي، وتجارب تستخدِم الحوسبة فائقة الإنتاجية، في الاقتراب خطوة من تحقيق هذا الهدف.

أنْدِرِيَاس فَاجْنَر
  • Published online:

تطال تأثيرات التعبير الجيني جميعَ جوانب الحياة، بدءًا من بقاء البكتيريا على قيد الحياة في بيئات معينة، ووصولًا إلى تشريح جسم الإنسان وخصائصه الفسيولوجية. والقدرة على التنبؤ بمستوى التعبير عن جين ما، بناءً على تسلسلات الحمض النووي التي تنظِّم عملية التعبير الجيني تلك، من شأنها أن تُحدث نقلة نوعية في دراسات الباحثين لعلم الأحياء. بَيْدَ أن الآليات البيوكيميائية التي تُنظِّم التعبير الجيني شديدة التعقيد. ورغم مساعي العلماء الجهيدة التي بذلوا فيها -على مدى أكثر من 50 عامًا- قصارى وسعهم للتنبؤ بعمليات التعبير الجيني تلك، استعصى الوصول إلى هذا الهدف. لكن في بحث نُشر مؤخرًا في دورية Nature، استخدم  الباحث فايشناف وفريقه البحثي1 تقنيتين بارزتين لابتكار "عرَّاف" آلي يتنبأ بنجاح بعمليات التعبير الجيني في خميرة الخبز Saccharomyces cerevisiae.

التقنية الأولى التي استخدمها هؤلاء الباحثون هي وسيلة لقياس التعبير عن الجين المرمِّز للبروتين الفلوري الأصفر (YFP) في كل خلية مُفرَدة من مجموعة كبيرة من خلايا الخميرة2، إذ حملتْ الخلايا المختلفة في هذه المجموعة تسلسلات حمض نووي متباينة تُنظِّم التعبير الجيني وتُسمَّى المُحفِّزات. وتقع هذه المُحفِّزات بالقرب من جين yfp على قطعة صغيرة من الحمض النووي الحلقي، فيسمح قربُها من هذا الجين بالتحكّم في التعبير عنه. وقد انتقى الباحثون مجموعة من أكثر من 30 مليون سلسلة من المُحفِّزات المختلفة، البالغ طول كل منها 80 زوجًا قاعديًا، وقاسوا مستوى إنتاج بروتين YFP في كل خلية تحتوي على أحد هذه المُحفِّزات.

بعد ذلك، لقَّم فايشناف وفريقه البحثي بيانات التعبير الجيني الناتجة في أداة أخرى تُسمَّى الشبكة العصبية الالتفافية، وهي تقنية الذكاء الاصطناعي الثانية التي عمدوا إليها. ودرَّبوا هذه الشبكة على التنبؤ بالتعبير الجيني بناءً على هذه البيانات. ثم أثبتوا قدرة الشبكة على التنبؤ بالتعبير الجيني بدرجة مذهلة من الدقة (الشكل 1).

على سبيل المثال، عمد الباحثون إلى تخليق الآلاف من سلاسل المحفزات الأخرى التي لم تُستخدَم في تدريب الشبكة العصبية، وقاسوا قدرة هذه المحفزات على التحكم في التعبير الجيني، وبرهنوا على أن الشبكة تستطيع التنبؤ بدقة كبيرة بمدى تحكم كل من هذه المُحفِّزات في التعبير الجيني. ثم عرض الباحثون على الشبكة سلاسل أولية عشوائية من الحمض النووي، وبيَّنوا أن قدرة الشبكة على التنبؤ بالتعبير الجيني من سلاسل الحمض النووي يمكن استخدامها لتحويل هذه السلاسل الأولية العشوائية إلى سلاسل محفزات، عن طريق عشر دورات لمحاكاة تطوُّر هذه السلاسل الأولية حوسبيًا إلى مُحفِّزات يُتوقَّع لها أن تستحثّ مستويات تعبير جيني مرتفعة للغاية أو منخفضة للغاية لجين yfp. بعد ذلك، خلَّق الفريق البحثي 500 من سلاسل المحفزات تلك لقياس قدرتها على تنظيم التعبير عن جين yfp. ونجحتْ هذه السلاسل المُنتَجة بالمحاكاة الحاسوبية بالفعل في تحفيز مستويات إما شديدة الارتفاع وإما شديدة الانخفاض من التعبير عن الجين. وأظهرت هذه التجربة وغيرها من تجارب إثبات صحة النتائج أن فايشناف وفريقه البحثي قد نجحوا في ابتكار عرَّاف آلي يتنبأ بكفاءة كبيرة بعمليات التعبير الجيني.

ويمكن لهذا العرَّاف أيضًا المساعدة على تفسير جوانب مُتعدِّدة من تطوُّر التعبير الجيني. على سبيل المثال، تمكَّن الباحثون حاسوبيًا من التنبؤ بأن حدوث ثلاث أو أربع طفرات في معظم سلاسل الحمض النووي الأوَّلية كافٍ لتطوير مستويات تعبير جيني مرتفعة للغاية أو منخفضة للغاية، وهو ما أكَّدوه تجريبيًا. واستنتجوا أيضًا أن ما يقرب من 70% من جينات الخميرة مُعرَّض لعملية انتخاب مُسبّبة لاستقرار التعبير الجيني (أي انتخاب يميل إلى تكوين الطفرات التي لا تُسبِّب تغيرات كبيرة في التعبير الجيني). بالإضافة إلى ذلك، أوضحوا أن الجينات المُعرَّضة لعملية انتخاب تسبب استقرار التعبير الجيني أصبحت أكثر مقاوَمة للطفرات المنظمة للتعبير الجيني في الحمض النووي. وهذا يعني أن الطفرات التي تحدث في مُحفِّزات هذه الجينات تؤثر تأثيرًا أقل في التعبير الجيني.

الشكل 1| تعلُّم التنبؤ بالتعبير الجيني. أ. أنشأ فايشناف وفريقه البحثي1 مكتبة تضم 30 مليونًا من سلاسل المحفزات، وهي سلاسل حمض نووي تتحكم في التعبير الجيني، ويبلغ طول كل منها 80 زوجًا قاعديًا. بعد ذلك، قاس الفريق البحثي مدى كفاءة كلٍّ من هذه السلاسل في التحكم في التعبير عن الجين المرمِّز للبروتين الفلوري الأصفر (YFP) في خلايا الخميرة. ب. واستخدم الفريق البحثي هذه البيانات لتدريب شبكة عصبية للتنبؤ بمدى قدرة المُحفِّزات المختلفة على التحكم في التعبير الجيني. ج. اختبر الفريق البحثي بعد ذلك قدرة الشبكة التنبؤية، وصمم آلافًا من المُحفِّزات الأخرى (يُظهِر الرسم واحدًا فقط للتبسيط)، وأوضحوا أن الشبكة يمكنها التنبؤ بدقة كبيرة بقدرة كل مُحفِّز على التحكم في التعبير الجيني.

الشكل 1| تعلُّم التنبؤ بالتعبير الجيني. أ. أنشأ فايشناف وفريقه البحثي1 مكتبة تضم 30 مليونًا من سلاسل المحفزات، وهي سلاسل حمض نووي تتحكم في التعبير الجيني، ويبلغ طول كل منها 80 زوجًا قاعديًا. بعد ذلك، قاس الفريق البحثي مدى كفاءة كلٍّ من هذه السلاسل في التحكم في التعبير عن الجين المرمِّز للبروتين الفلوري الأصفر (YFP) في خلايا الخميرة. ب. واستخدم الفريق البحثي هذه البيانات لتدريب شبكة عصبية للتنبؤ بمدى قدرة المُحفِّزات المختلفة على التحكم في التعبير الجيني. ج. اختبر الفريق البحثي بعد ذلك قدرة الشبكة التنبؤية، وصمم آلافًا من المُحفِّزات الأخرى (يُظهِر الرسم واحدًا فقط للتبسيط)، وأوضحوا أن الشبكة يمكنها التنبؤ بدقة كبيرة بقدرة كل مُحفِّز على التحكم في التعبير الجيني.

كبر الصورة

وثمة أسباب عدة تُكسِب هذا البحث أهميته؛ أوّلها أنه يمكن أن يساعد على تصميم جينات ذات مستوى تعبير جيني مُحدَّد. وثانيها، أنه يمكن أن يساعد على تفسير عديد من جوانب تطوّر تنظيم الجينات. ومن الجدير بالملاحظة أن هذا البحث من شأنه أن يُمكِّن العلماء كذلك من اكتشاف إجابات لطيفٍ واسعٍ من التساؤلات التي يفوق عددها ما قد يمكن لأي فريق بحثي التصدّي له بمفرده، على غرار ما حدث مع تطبيقات التعلُّم العميق الأخرى التي استُخدِمت خلال الأعوام القليلة الماضية في علم الأحياء، مثل تطوير أدوات للتنبؤ بطي البروتين3.

وعلى الرغم من أهمية هذا العرّاف الآلي، فإن بعض أوجه القصور تشوبه. أولها أنه يحاكي التغيُّرات في المُحفِّزات فقط، وهي واحدة ضمن عديدٍ من سلاسل الحمض النووي التي يمكن أن تؤثِّر في التعبير الجيني. بالإضافة إلى ذلك، لا يأخذ العراف في الحسبان تأثيرَ التغيُّرات في سلاسل الحمض النووي المجاورة، مثل المنطقة المُرمِّزة للبروتين، والتي قد تؤثر في التعبير الجيني. ومن أوجه القصور الأخرى، أن العرَّاف طُوِّر للتنبؤ بالتعبير الجيني في فطر الخميرة، والذي يتَّسم تنظيم الجينات فيه بأنه أقل تعقيدًا مقارنةَ بالإنسان. على سبيل المثال، الحمض النووي المُنظِّم للتعبير الجيني في الخميرة يبعُد عادة عن الجين الذي يتحكَّم في التعبير عنه بمقدار بضع مئات من الأزواج القاعدية، في حين أن الحمض النووي المُنظِّم للتعبير الجيني في الحيوانات قد يقع على بعد ملايين من الأزواج القاعدية من الجين الذي ينظِّم التعبير عنه. لذا، ليس من الواضح ما إذا كانت مقاربة فايشناف وفريقه البحثي يمكن أن يمتد تطبيقها إلى عمليات التنظيم الجيني الأكثر تعقيدًا. ومما يدعو إلى بعض التفاؤل المشوب بحذر أن هذه الطريقة ناجحة إلى حد كبير، رغم أن سلاسل الحمض النووي التي استُخدِمت في تدريب الشبكة العصبية الالتفافية، والبالغ عددها ثلاثين مليونًا، لا تمثِّل إلا نسبة صغيرة للغاية (نحو 2 ×10-41) من 804 صورة محتملة لأشرطة الحمض النووي، التي يبلغ طولها 80 قاعدة، تؤلِّفها نيوكليوتيدات الحمض النووي الأربع. إذًا، قلة عينات التسلسلات المُستخدَمة في تدريب الشبكة قد لا تكون عقبة كؤودًا تَحُول دون نجاح هذه الطريقة.

وختامًا، مثل أي عرَّاف في الأساطير، فإن هذا العرَّاف الآلي يتنبَّأ بعمليات التعبير الجيني، لكنه لا يُفسِّرها.

ولا يوضِّح سبب ارتفاع أو انخفاض مستوى التعبير الجيني الذي يستحثّه محفّزٌ ما. كما لا يُحدِّد أي عوامل نسخ ترتبط بالمُحفِّز، أو كيفية تفاعُل عوامل النسخ تلك. بعبارة أخرى، فإن هذا النموذج للتنبؤ بالتعبير الجيني لا يُفسِّر بصورة كبيرة آليةَ تنظيم التعبير الجيني. ويتطلّب تخطي هذا القصور كثيرًا من العمل5,4,2. لكن بالنظر إلى أن التنبؤ بالتعبير الجيني ظل لوقت طويل يُمثِّل مُعضلة، فلا حاجة بنا إلى عرَّاف لتوقُع ترحيب علماء الأحياء بتلك التقنية وتبنيهم لها.

References

  1. Vaishnav, E. D. et al. Nature 603, 455–463 (2022). | article
  2. de Boer, C. G. et al. Nature Biotechnol. 38, 56–65 (2020). | article
  3. Jumper, J. et al. Nature 596, 583–589 (2021). | article
  4. Zhou, J. & Troyanskaya, O. G. Nature Methods 12, 931–934 (2015). | article
  5. Alipanahi, B., Delong, A., Weirauch, M. T. & Frey, B. J. Nature Biotechnol. 33, 831–838 (2015). | article

يعمل أنْدِرِيَاس فَاجْنَر في قسم البيولوجيا التطورية والدراسات البيئية بجامعة زِيورخ، في مدينة زِيورخ (CH-8057)، بسويسرا، وفي معهد ستِيلِينبُوش للدراسات المُتقدِّمة، جامعة ستِيلِينبُوش، في مدينة ستِيلِينبُوش، بجنوب إفريقيا.

البريد الإلكتروني: andreas.wagner@ieu.uzh.ch