افتتاحيات

الذكاء الاصطناعيّ يترك بصمة أبدية في مجال علم الأحياء البنيوي 

سوف تغيُّر تقنيّات تعلُّم الآلة من فهم العلماء لآليّات طيّ البروتين. ولذلك، من الضروريّ فتح السبل أمام توفير بيانات في هذا الصدد.

  • Published online:

"ما كنت أظن أن العلم قد يصل إلى هذه النقطة في حياتي". هكذا عقّب قائد إحدى الفرق البحثيّة المتخصصة في مجال علم الأحياء البنيوي على دراسة نُشرت خلال الأسبوع الماضي، استُخْدِمَ فيها الذكاء الاصطناعي لتوقُّع بِنْية أكثر من 20 ألف بروتين بشري، إضافة إلى جميع البروتينات المعروفة تقريبًا التي ينتجها 20 كائن تجارب؛ مثل بكتيريا الإشريكية القولونية Escherichia coli، وذباب الفاكهة، وفطر الخميرة، وكذلك فول الصويا، والأرز الآسيويّ. ويبلغ مجموع هذه التنبؤات حوالي 365 ألف تنبؤ1.

هذه البيانات، التي أُتيحت وأُعلن عنها لأول مرة (انظر: https://alphafold.ebi.ac.uk)، أصدرها على الإنترنت فريق بحثي بشركة »ديب مايند« DeepMind – وهي شركة متخصصة في تقنيات الذكاء الاصطناعيّ يقع مقرها في لندن، وتملكها شركة «ألفابيت» Alphabet، الشركة الأمّ لشركة «جوجل» Google – ومعهد المعلوماتيّة الحيويّة الأوروبيّ، الكائن في مختبر علم الأحياء الجزيئي الأوروبيّ (EBI-EMBL) بالقرب من مدينة كامبريدج بالمملكة المتحدة.

"أدوات الذكاء الاصطناعيّ قادرة على توقع البِنى البروتينيّة بدقة خلال مدة تتراوح من دقائق إلى عدة ساعات". 

طوَّر فريق شركة «ديب مايند» أداة تستخدم تقنية تعلُّم الآلة، تسمَّى «ألفافولد» AlphaFold، ودرَّبها على التعرُّف على تسلسلات الحمض النووي، بما في ذلك تاريخه التطوريّ، والأشكال المعروفة بالفعل لعشرات الآلاف من البروتينات التي اختُزنت بياناتها في قاعدة بيانات معلنة للبِنى البيولوجية البروتينية، يستضيفها على الإنترنت باحثو معهد المعلوماتية الحيوية الأوروبي، التابع لمختبر علم الأحياء الجزيئي الأوروبي. وقبل ذلك بأسبوع، كانت شركة «ديب مايند» قد نشرت أيضًا الكود المصدري لأداة «ألفافولد»، وقدَّمت شرحًا تفصيليًّا لكيفيّة تصميمه2، وذلك في الوقت نفسه الذي نشر فيه باحثون من جامعة واشنطن في سياتل تفاصيل عن برنامج آخر لتوقُّع البِنى البروتينيّة - مُستوحى من «ألفافولد» - يُسَمَّى »روز تي تي إيه فولد« RoseTTAFold (المرجع 33).

وما كان الإعلان عن قائمة البِنى البروتينيّة المتوقعة تلك ليُعَد بأي حال نبأ سارًّا إلى هذا الحد، لولا الإفصاح عن بياناتها والمنهجيّة البحثيّة التي استُخدمت في وضعها، وإتاحتهما مجانًا. وقد بدأ بالفعل اختصاصيو علم الأحياء البنيوي وباحثون آخرون في استخدام أداة «ألفافولد» للوصول إلى نماذج أدقّ للبِروتينات التي استعصى - أو استحال - توصيفها بالطرق التجريبيّة الحالية.

 

إسراع وتيرة توقُّع البِنى البروتينية

ظل توقُّع الشكل ثلاثيّ الأبعاد الذي تتخذه البروتينات في عملية طيّها أحد "أكبر التحديّات" التي استعصت على الحل في علم البيولوجيا منذ اكتشاف بِنية الحمض النوويّ نفسه في عام 1953. وتجدر الإشارة إلى أنه قبل ابتكار تقنيات الذكاء الاصطناعيّ، كانت عمليّة توقُّع البِنى البروتينيّة من تسلسل الحمض النووي عمليّة تستهلك الكثير من الوقت والجهد، ولا تضمن بدرجة كبيرة الحصول على نتائج دقيقة. والبيانات الجديدة التي أنتجتها هذه العملية لا تزال بحاجة لإثباتها وتأكيدها تجريبيًّا. أما أدوات الذكاء الاصطناعيّ، فقادرة على توقع البِنى البروتينيّة بدقة خلال مدة تتراوح من دقائق إلى عدة ساعات، مقارنة بالشهور أو السنوات التي كانت تستغرقها محاولة تحديد بِنْية بروتين واحد أو اثنين. وهذا يفتح آفاقًا لتطبيقات مختلفة، مثل هندسة الإنزيمات لتحليل الملوِّثات البيئيّة، مثل البلاستيك المجهريّ.

لم تعتمد الطفرة العلمية التي أعلن عنها الأسبوع خلال الماضي على مشاركة بيانات معلنة فحسب، بل قامت كذلك على خطوات إلى الأمام أُحرِزت في العلوم والتقنيّات الأساسيّة. فمنذ ستينيات القرن العشرين، سلك اختصاصيو علم الأحياء البنيوي عدة منهجيّات بالتوازي معًا لفهم الآليات العلمية وراء طيّ البروتينات. وقد تضمنت تلك المنهجيّات التوصل إلى البِنى البروتينية من خلال فهم آلياتها الفيزيائية الكامنة. وتمثلت محاولة أخرى في توقُّع أشكال البروتينات بعقد مقارنة بينها وبين البروتينات الأقرب صلة لها، من خلال الرجوع إلى التاريخ التطوريّ للكائن الحيّ. كما كان لتقنيّات التصوير الشعاعي دور شديد الأهميّة، بدءًا من التصوير البلوريّ بالأشعة السينيّة، حتى التصوير بالمجهر الإلكتروني فائق التبريد حاليًّا، بيد أن المعارف الأساسية التي يرتكز عليها علم الأحياء البنيوي ما زالت تكتنفها إشكاليات تتطلب وضع حلول لها. فرغم أن تقنيات الذكاء الاصطناعيّ مفيدة في استحداث نتائج دقيقة في المجالات العلمية والتكنولوجية، إلا أنها (حتى الآن على أقل تقدير) لا تفسِّر كيفية حدوث تلك النتائج أو أسبابها. وعلينا تهنئة الفرق البحثيّة في شركة «ديب مايند»، ومعهد المعلوماتية الحيوية الأوروبي، وجامعة واشنطن، والجهات البحثية الأخرى على إنجازاتها العلمية بالغة الأهمية في هذا الصدد. ومع ذلك، تجدر الإشارة إلى أن الكثير من الأبحاث لا تزال تنتظر إجراءها للكشف عن الأسرار العلمية وراء الخواص البيولوجية والكيميائية والفيزيائية الأساسية التي تتحكم في آليات عملية طيّ البروتينات، وأسباب هذه العملية.

 

أهمية البيانات المُعلنة

يشبِّه البعض هذه الاكتشافات الحديثة من حيث أهميتها بوضع أول خريطة مبدئية للتسلسل الجينومي البشريّ قبل 20 عامًا. والحق أن هناك أوجه تشابه بالفعل، فكل من »مشروع الجينوم البشريّ« Human Genome Project، وقائمة شركة «ديب مايند» لتوقعَّات البِنى البروتينيّة البشريّة يزودان مجاليهما بأداةٍ مُعَدة لإسراع وتيرة الاكتشافات بدرجة كبيرة.

وقد جاءت أول خريطة مبدئيّة للجينوم البشريّ نتيجة لسباق. وتأتى حل ألغاز عملية طيّ البروتينات بدوره نتيجة منافسة سنويّة تسمَّى »التقدير التوقعيّ للبِنى البروتينية« Critical Assessment of Protein Structure Prediction (أو اختصارًا CASP)، وقد كانت منافسة ضروريّة للحصول على نتائج في هذا الصدد.

احتاجت الفرق البحثية في عصرنا الحالي - تمامًا مثل الفرق البحثيّة في الأيام المبكرة لتعيين التسلسل الجينومي – إلى وصولٍ مفتوحٍ إلى البيانات. وقد صارت شركة »ديب مايند« مثالًا يُحتذى به في هذا الصدد بإعلانها إتاحة الوصول المفتوح إلى بياناتها ومنهجيّاتها البحثيّة، وهو ما يضع المؤسسات الأخرى في هذا المجال، مثل شركة «فيسبوك»، وشركة «مايكروسوفت»، في موقف صعب لدى حجاجها دفاعًا عن سرية بياناتها.

والآن، ماذا عن المستقبل؟ على مدار الأسبوع الأخير من شهر يوليو الماضي، أجرت دورية Nature مقابلات مع حوالي اثني عشر باحثًا في المجال. وقد أجمعوا على أنه من المبكر جدًّا التنبؤ بدقة بتأثيرات تطبيقات الذكاء الاصطناعيّ على العلوم الحيويّة، إلا أنهم يرون أن تأثيراتها في جميع الأحوال ستكون ثورية.

إن التنبؤ بدقة بالتغييرات التي سيحدثها الذكاء الاصطناعيّ في علم البيولوجيا سيحتاج إلى بيانات تدريبيّة جيدة، وهو ما لا نملكه بعد، بيد أنه في مجال الذكاء الاصطناعيّ، يمتلك المجتمع البحثيّ المتخصص في علم الأحياء البنيوي – والجهات المتعاونة معه من المجالات الأخرى – ثروة ضخمة من البيانات الحديثة. وإضافة إلى ما يفتحه الذكاء الاصطناعيّ من أبواب للبحث، وما يوفره من بيانات، فإنه يفتح آفاقًا لتطبيق نماذج جديرة بأن تدرسها الجامعات فيما يتعلق بتنظيم البحوث وإدارتها. وبالنسبة إلى باحثي اليوم، وباحثي الأجيال القادمة، فثمة الكثير مما يجب القيام به استكمالًا لهذه المسيرة. 

References

  1. Tunyasuvunakool, K. et al. Nature https://doi.org/10.1038/s41586-021-03828-1 (2021). | article
  2. Jumper, J. et al. Nature https://doi.org/10.1038/s41586-021-03819-2 (2021). | article
  3. Baek, M. et al. Science https://doi.org/10.1126/science.abj8754 (2021). | article