تكنولوجيا

التعلم العميق يواجه الأورام

الأساليب البحثية المعتمِدة على الذكاء الاصطناعي تغزو أبحاث السرطان

إستر لاندهيوس
  • Published online:

Shutterstock

يراقب جيوم جاكميه الخلايا السرطانية أثناء انتشارها في طبق الاستزراع، حيث تكشف حركتها معلومات عن كيفية تأثير الأدوية أو التعديلات الجينية على انتشار الأورام في الجسم. ويتتبع نواةَ كل خلية، إطارًا بعد إطار في الأفلام المصورة، من خلال تقنية التصوير المجهري المتقطع، لكنْ نظرًا إلى أنه صوَّر حوالي 500 فيلم، ويحتوي كل منها على 120 إطارًا، ويتضمن كل إطار من 200 إلى 300 خلية، فليس من المغالاة في شيء وصف هذا التحليل بأنه فائق الصعوبة، بيد أن جاكميه، المتخصص في علم الأحياء الخلوي في جامعة أوبو أكاديمي في توركو بفنلندا، يقول عن ذلك: "لو اضطررت لإجراء عملية التتبع يدويًّا، لكان إجراؤها ضربًا من المستحيل".

من أجل ذلك.. درَّب آلة لرصد نوى الخلايا بدلًا منه. وهو يستخدم في ذلك الطرق المتوفرة على منصة تسمى «زيرو كوست دي إل فور ميك» ZeroCostDL4Mic، وهي جزء من مجموعة متنامية من الموارد، تهدف إلى جعل تقنية الذكاء الاصطناعي في متناول باحثي المختبرات ذوي الخبرة القليلة للغاية في كتابة الأكواد البرمجية1.

تَستخدِم تقنيات الذكاء الاصطناعي عدة آليات. وعلى سبيل المثال.. تستخدم إحداها -التي تسمى بتقنية تعلم الآلة- البيانات التي خضعت للمعالجة يدويًّا، وتقدم تنبؤات وفقًا لما تعلمه برنامج الذكاء الاصطناعي. وعلى النقيض من ذلك.. فإن نهج التعلم العميق يمكنه تحديد الأنماط المعقدة في البيانات الأولية، ولذا يُستخدم في السيارات ذاتية القيادة، وبرامج التعرف على الكلام، وأجهزة الكمبيوتر التي تمارس الألعاب، إلى جانب رصد نوى الخلايا في مجموعات البيانات المجهرية الضخمة.

وتعود أصول التعلم العميق إلى أربعينيات القرن العشرين، عندما بنى العلماء نموذجًا لحاسوب في صورة طبقات مترابطة تشبه الخلايا العصبية في الدماغ البشري. وبعد ذلك بعقود، علَّم الباحثون هذه "الشبكات العصبية" التعرف على الأشكال، والكلمات، والأرقام، لكنْ لم يبدأ التعلم العميق في اكتساب شعبية في مجالَي الأحياء والطب، إلا قبل حوالي خمس سنوات.

تمثلت القوة الدافعة الرئيسة وراء هذه الشعبية في النمو الهائل في بيانات علوم الحياة. فمن خلال تقنيات التسلسل الجيني الحديثة، يمكن لتجربة واحدة أن تُنتِج جيجابايت من المعلومات. فعلى سبيل المثال.. جمع مشروع «أطلس جينوم السرطان» The Cancer Genome Atlas -الذي أُطلق في عام 2006- معلومات من عشرات الآلاف من العينات التي تغطي 33 نوعًا من السرطان، ويتجاوز حجم هذه البيانات 2.5 بيتابايت (البيتابايت الواحد يساوي مليون جيجابايت). وإضافة إلى ذلك.. تُنتِج التطورات في مجال وَسْم الأنسجة والفحص المجهري الآلي بيانات تصوير معقدة على نحو أسرع من قدرة الباحثين على التنقيب فيها. تقول إيما لندبِرج، المتخصصة في الهندسة الحيوية في معهد كيه تي إتش الملكي للتكنولوجيا في ستوكهولم: "لا شك أن هناك ثورة تحدث في هذا المجال".

تعزيز عمليات التنميط القائمة على الصور

انتبه عالِم الأحياء المتخصص في دراسات السرطان، نيل كاراجر، للشرارة الأولى لهذه الثورة في عام 2004. آنذاك، كان يقود فريقًا في شركة «أسترا زينيكا» AstraZeneca في لوبورو بالمملكة المتحدة، حيث عمل الفريق على استكشاف تقنيات جديدة تخدم علوم الحياة، وذلك عندما صادف كاراجر دراسة جعلت الشركة تعيد التفكير في عمليات فحص الأدوية التي تجريها، إذ كان هو وفريقه يستخدمون مسوحًا للخلايا، للبحث عن الأدوية المحتملة الواعدة، لكنها كانت عملية شديدة الصعوبة. وقد أشارت الدراسة إلى أن الذكاء الاصطناعي وتقنيات التحليل يمكن أن تساعد الفريق على تحسين عمليات الفحص التي يجريها2. ويقول كاراجر معلقًا على ذلك: "اعتقدنا أن ذلك ربما يكون حلًّا لمشكلة الإنتاجية".

قد يكون من الصعب على علماء الأحياء إتقان استخدام تقنيات الذكاء الاصطناعي، فأوضح جاكميه أنه أمضى ذات مرة أكثر من أسبوع في محاولة تثبيت مكتبات البرمجيات اللازمة، من أجل تشغيل أحد نماذج التعلم العميق، ثم أضاف قائلًا: "عليك أن تتعلم لغة البرمجة «بايثون» Python" من أجل استخدام هذا النموذج".

تعاوَن فريق كاراجر في "أسترا زينيكا" مع آن كاربنتر -المتخصصة في علم الأحياء الحاسوبي- وزملائها من معهد برود، التابع لكل من معهد ماساتشوستس للتكنولوجيا، وجامعة هارفارد بكامبريدج في ولاية ماساتشوستس، وذلك لتسريع عمليات تنميط الخلايا القائمة على الصور، التي استُخدمت في الدراسة التي أجريت في عام 2004، ولدراسة آثار أدوية متعددة على خلايا سرطان الثدي لدى البشر3، فشرعت كاربنتر في تطوير التقنية، لتتمثل في عملية تسمى «طلاء الخلايا»، وهي عملية تطلي الخلايا بمجموعة من الأصباغ الفلورية، ثم تستخدم برنامج «سيل بروفايلر» CellProfiler مفتوح المصدر، لتنميط الخلايا.

ومع ذلك.. يرى كاراجر -الذي يرأس حاليًّا فريق البحث عن علاجات دوائية للسرطان في جامعة إدنبرة بالمملكة المتحدة- أن هذه التحليلات يمكن أن تتطلب الكثير من الأفراد. ويعتقد أنه حتى مع استخدام الأدوات مفتوحة المصدر، التي تُغْنِي عن الحاجة إلى كتابة أكواد برامج تعلُّم الآلة من البداية، واستخدام مجموعة حواسيب تحتوي على آلاف المعالجات، وتتطلب مساحة ضخمة من الذاكرة قد تصل إلى عدة تيرابايتات، فربما يستغرق تحديد الميزات الخلوية التي ينبغي للفريق توجيه برنامج تحليل الصور للبحث عنها مدة تصل إلى شهر، أو نحو ذلك. وبالإضافة إلى ذلك.. فبعد تحسين المعايير وضبطها لكل نوع من الخلايا، اضطر الفريق إلى تعديل البرنامج، لكي يعمل عبر جميع الخلايا.

يتم رصد نوى الخلايا (في الجزء الأعلى، عينة الحمض النووي الموسومة) تلقائيًّا باستخدام طريقة برنامج «سيل بروفايلر» CellProfiler (في الجزء الأسفل).

يتم رصد نوى الخلايا (في الجزء الأعلى، عينة الحمض النووي الموسومة) تلقائيًّا باستخدام طريقة برنامج «سيل بروفايلر» CellProfiler (في الجزء الأسفل).

C. McQuin et al./PLoS Biol. (CC BY 4.0)

في العام الماضي، استطلع كاراجر وفريقه الطريقة التي يمكن من خلالها للتعلم العميق تحسين هذه العملية، وكان دافعهم نحو ذلك تحليل4 أُجري في عام 2017، ونَشَره باحثون في مقر شركة «جوجل» Google في ماونتن فيو بكاليفورنيا على خادم المسودات البحثية »بيو آركايف« bioRxiv . قام الباحثون بتنزيل مجموعة بيانات كاراجر الخاصة بسرطان الثدي من مجموعة «بيو إيمدج بينش مارك كولكشن» Bioimage Benchmark Collection، واستخدموها لتدريب شبكة عصبية عميقة لم ترَ من قبل سوى صور عامة، مثل السيارات، والحيوانات. ومن خلال إجراء عمليات مسح، بحثًا عن أنماط في بيانات سرطان الثدي، تعلم النموذج تمييز التغيُّرات الخلوية ذات الدلالة في عملية اكتشاف الأدوية المناسبة. ونظرًا إلى أنه لم يتم إخبار البرنامج عما يجب البحث عنه، فقد رصد ميزات لم يفكر فيها الباحثون من الأساس.

واستكمالًا لهذه الجهود، فحص كاراجر وزملاؤه 14 ألف مُركّب عبر ثمانية أشكال من سرطان الثدي5. وقال في هذا الصدد: "لقد توصلنا إلى بعض النتائج المثيرة للاهتمام". وتضمنت هذه النتائج مُركّبًا كان معروفًا بالفعل بتعديل مستقبِلات السيروتونين، وهو ناقل عصبي مهم، من أجل تطور الغدد الثديية، كما ورد في تقريرهم في وقت سابق من هذا العام6.

"عندما نستطيع تقييم هذه المعلومات، بدلًا من مجرد توصيفها، يمكننا دمجها مع أنواع بيانات أخرى".

في الوقت نفسه، يستخدم فريق بقيادة عالِم الأحياء الحاسوبية خوان كايسيدو -من معهد برود التنميط- القائم على الصور، من أجل إجراء عمليات مسح؛ للكشف عن الطفرات الجينية، إذ قام هو وفريقه بزيادة التعبير عن المتغيرات الجينية المختلفة في خلايا سرطان الرئة على نحو مفرط، ووَسَموها باستخدام بروتوكول «طلاء الخلايا»، وبحثوا عن الاختلافات في الخلايا التي ربما تشير إلى وجود فرص محتملة للعلاج الدوائي. واكتشف الفريق أن تقنية تعلم الآلة يمكن أن تحدد المتغيرات ذات الدلالة في الصور المتعلقة بالتعبير الجيني في الخلايا، وكذلك العمليات التي تقيسه. ونشر الفريق نتائجه في مؤتمر «اكتشاف وتصنيع الأدوية، المدعوم بالذكاء الاصطناعي» AI Powered Drug Discovery and Manufacturing Conference في فبراير في معهد ماساتشوستس للتكنولوجيا بمدينة كامبريدج.

وفي إطار »مبادرة رسم خريطة خلايا السرطان« Cancer Cell Map Initiative، التي ترسم خريطة الشبكات الجزيئية الكامنة وراء الإصابة بالسرطان لدى البشر، يعمل الباحثون على تدريب نموذج للتعلم العميق، من أجل التنبؤ بالاستجابات الدوائية على أساس تسلسل جينوم السرطان لدى الشخص. ويرى تراي إيديكر -المتخصص في الهندسة الحيوية في جامعة كاليفورنيا بمدينة سان دييجو- أن هذه التنبؤات لها دلالات فيما يخص البقاء على قيد الحياة، ودِقّتها هي أمر حيوي، لكن البعض يتردد في قبول نتائج هذه العملية عندما تكون الآليات الكامنة وراءها غير واضحة، إذ تُقدم الشبكات العصبية العميقة إجابات، دون الكشف عن الآليات التي سلكتها في تقديم هذه الإجابات، وهي المشكلة التي تُعرف باسم نهج «الصندوق الأسود» في التعلم العميق. ويضيف إيديكر حول ذلك قائلًا: "نرغب في معرفة السبب، وفي معرفة الآليات الكامنة وراء هذه التنبؤات". من هنا، يعمل فريق إيديكر على إنشاء شبكة عصبية "مرئية"، تربط -بصورة مباشرة- بين الآليات الداخلية لعمل نموذج التعلم العميق، وبيولوجيا الخلايا السرطانية. كما أنشأ الفريق نموذجًا لخلايا الخميرة، كدليل على نجاح الفكرة. ويستطيع هذا النموذج، الذي يسمى «دي سيل» DCell، التنبؤ بتأثيرات الطفرات الجينية على نمو الخلايا، وبالمسارات الجزيئية الكامنة وراء هذه التأثيرات7.

البُعْد المكاني

تستخدم إيما لندبِرج وآخرون في السويد التعلم العميق للتعامل مع تحدٍّ حاسوبي آخر، وهو تقييم موقع البروتينات. ويُعَد هذا البحث جزءًا من «أطلس البروتينات البشرية» Human Protein Atlas، وهو مشروع قائم على تحليل متعدد "الأوميات"، يمتد على مدار سنوات عديدة، لرسم خريطة لجميع البروتينات البشرية. وتقول لندبِرج إن المعلومات المكانية هنا تكشف عن مكان وجود البروتينات في الخلايا، بيد أن هذه المعلومات غالبًا لا تُقدَّم على نحو كافٍ في الدراسات التي تتم على المستوى الجهازي. وتشير إلى أنه إذا عرف الباحثون هذه المعلومات، سيستطيعون استخدامها لاستقاء معلومات عن السمات الأحيائية الأساسية.

وهنا يأتي دور الذكاء الاصطناعي. ففي عام 2016، دعت لندبِرج وزملاؤها ممارسي ألعاب الحاسوب، لمساعدة أجهزة الحاسوب على تصنيف أماكن البروتينات في الخلايا. وشارك العلماء في تجربة التعهيد الجماعي هذه، في لعبة تناوُب أدوار تسمى «إيف أونلاين» EVE Online، حيث كان عليهم تحديد البروتينات التي تحمل واسمة فلورية من أجل كسب نقاط اللعبة، وهو ما يعزز نظام الذكاء الاصطناعي المستخدَم بالفعل لهذا الغرض، لكنْ حتى هذا النظام المعزز يُعتبر أقل كفاءة من الخبراء البشريين فيما يتعلق بالدقة والسرعة.

"لو اضطررت لإجراء عملية التتبع يدويًّا، لكان إجراؤها ضربًا من المستحيل".

لذا.. نقل فريق لندبِرج صوره في عام 2018 إلى موقع «كاجل» Kaggle، وهو منصة تطرح تحديات أمام خبراء تعلم الآلة؛ من أجل تطوير أفضل نماذج لحل الألغاز المحيطة بمجموعات البيانات التي تنشرها الشركات والباحثون. وعلى مدار ثلاثة أشهر، تنافس 2172 فريقًا حول العالم من أجل تطوير نموذج التعلم العميق الذي يستطيع فحص خلية موسومة، بحثًا عن أحد البروتينات، والعديد من العلامات المرجعية، ليرسم خريطة توضح التوزيع المكاني للبروتين.

وعلى حد قول لندبِرج.. كانت المهمة صعبة، إذ يوجد نصف البروتينات البشرية في أماكن متعددة داخل الخلايا. ويُعَد بعض الأجزاء الخلوية –كالنواة، على سبيل المثال- من المواقع التي تنتشر فيها البروتينات أكثر من غيرها.

ورغم ذلك.. تشير لندبِرج إلى أن المشاركين في الموقع نجحوا في المهمة. وجاء معظم الاستراتيجيات الرائدة من علماء متخصصين في الحاسوب من دون أي خلفية في علم الأحياء، وكان منهم بويان تونجوز، مهندس البرمجيات الذي ابتكر نماذج تتنبأ بالزلازل، والتخلف عن سداد القروض، قبل أن يتبوأ أحد أعلى المراتب في مسابقة «أطلس البروتينات البشرية». ويعتقد تونجوز أن النهج المتبع لحل هذه المشكلات يتشابه عبر التخصصات المختلفة إلى حد كبير.

وقد أوضحت لندبرج أن النموذج الأفضل حدد كلًّا من المواقع النادرة والشائعة للبروتينات عبر مجموعة متنوعة من الخلايا، إلى جانب أداء العملية الأكثر أهمية، ألا وهي تحديد الأنماط المختلطة على نحو دقيق، حيث عملت هذه الخوارزمية بدقة مساوية تقريبًا لدقة الخبراء البشريين، وبسرعة أكبر، وأمكن تكرار نتائجها بدرجة أكبر في التجارب الأخرى. وفضلًا عن ذلك.. كانت تستطيع تقييم المعلومات المكانية8. وعلى حد قول لندبِرج "عندما نستطيع تقييم هذه المعلومات، بدلًا من مجرد توصيفها، يمكننا دمجها مع أنواع بيانات أخرى"، بما فيها بيانات عمليات »التحليل متعدد الأوميات«، التي تُحْدِث حاليًّا ثورة في أبحاث السرطان.

وثمة إطار عمل حاسوبي معروف باسم «ديب بروج» DeepProg، يطبِّق تقنية التعلم العميق على مجموعات البيانات المستقاة من عمليات «التحليل متعدد الأوميات»، بما في ذلك بيانات التعبير الجيني، والبيانات فوق الجينية، للتنبؤ –على سبيل المثال– ببقاء المريض على قيد الحياة9. ويتنبأ نموذج «ديجيتال دي إل سورتر» DigitalDLSorter بالنتائج من خلال استنتاج أنواع الخلايا المناعية، وكمياتها مباشرة من بيانات تسلسل الحمض النووي الريبي (RNA) للورم، بدلًا من الاعتماد على نظم العمل التقليدية الشاقة10.

تطورات في المستقبل القريب

يتوفر العديد من الأدوات اللازمة لبناء نماذج التعلم العميق مجانًا عبر الإنترنت. وتشمل تلك الأدوات مكتبات البرمجيات، وأطر عمل كتابة الأكواد البرمجية،  مثل مكتبة «تينسو-رفلو» TensorFlow، ومكتبة «باي -تورتش» PyTorch، ومكتبة «كيراس» Keras، ومكتبة «كافيه» Caffe. ويمكن للباحثين الراغبين في طرح الأسئلة وتبادُل الأفكار عبر العصف الذهني، لحل المشكلات التي تطرأ فيما يتعلق بأدوات تحليل الصور، الاستفادة من مَوْرِد عبر الإنترنت يسمى «منتدى صور المجتمع العلمي» (https://forum.image.sc). كما بدأت تتوفر مستودعات عبر الإنترنت، تسمح للباحثين بالبحث عن نماذج التعلم العميق، وتغيير وظائفها لتناسب المهام الخاصة بهم، وهي العملية التي تسمى نقل التعلُّم. ويُعَد موقع «كيبي» Kipoi أحد هذه المستودعات، ويسمح للباحثين بالبحث واستكشاف أكثر من ألفي نموذج جاهز للاستخدام، مدربة على مهام معينة، مثل التنبؤ بكيفية ارتباط بروتينات معينة -معروفة باسم عوامل النسخ- بالحمض النووي، أو التنبؤ بالأماكن التي من المحتمل أن تلصِق الإنزيمات فيها الشفرة الوراثية.

ومن خلال العمل مع مطوري أدوات آخرين، أنشأ فريق لندبِرج صورة أولية من "مستودع لتطبيقات تعلم الآلة" (https://bioimage.io)؛ بهدف مشاركة نماذج «أطلس البروتينات البشرية» على نحو سريع. ويعمل الفريق حاليًّا على إنشاء مستودع أكثر تطورًا، بحيث يكون مفيدًا لمنتجي النماذج، والمستخدمين غير الخبراء، على حد سواء.

وأشارت لندبرج إلى مشاركة منصة تسمى «إيمجوي» ImJoy في هذا المشروع. وهذه المنصة -التي أنشأتها باحثة ما بعد الدكتوراة وي وويانج في مختبرها- تتيح للباحثين اختبار نماذج الذكاء الاصطناعي وتشغيلها من خلال متصفح الويب على جهاز الحاسوب الخاص بهم، أو سحابيًّا، أو عبر الهاتف. وستأتي مشاركة مجموعات بيانات التصوير البيولوجي ونماذج التعلم العميق أيضًا على رأس أولويات «مركز التحليل المفتوح للصور الحيوية» Center for Open Bioimage Analysis، وهو المشروع الذي تموله حكومة الولايات المتحدة، ويقوده كل من آن كاربنتر، وكيفن إليسيري، متخصص الهندسة البيولوجية في جامعة ويسكونسن ماديسون.

ويوجد خيار آخر، هو منصة «زيرو كوست دي إل فور ميك» ZeroCostDL4Mic، التي تم إطلاقها خلال الشهر الماضي. وهذه المنصة -التي طورها عالم الفيزياء الحيوية ريكاردو هنريكيس في جامعة يونيفيرسيتي كوليدج لندن- تَستخدم مشروع الخدمة السحابية المجانية «كولاب» Colab، وهي خدمة توفرها شركة «جوجل» Google لمطوري الذكاء الاصطناعي، وذلك من أجل منح إمكانية الوصول إلى العديد من أدوات الفحص المجهري الرائجة، القائمة على التعلم العميق، التي تتضمن الأداة التي يستخدمها جاكميه في أتمتة وَسْم نوى الخلايا في أفلامه. وفي ذلك الصدد.. يقول جاكميه: "يجري تثبيت كل ما تحتاجه في غضون دقيقتين". فمن خلال بضع نقرات بفأرة الحاسوب، يستطيع مستخدمو المنصة استخدام البيانات النموذجية لتدريب الشبكة العصبية على إكمال المهمة المطلوبة (انظر: «مطلوب مزيد من البيانات»)، ثم استخدام هذه الشبكة العصبية على بياناتهم الخاصة. ويحدث كل ذلك، دون الحاجة إلى كتابة أي أكواد برمجية.

يمكن لنماذج التعلُّم العميق معالجة البيانات الأولية، لكن يجب تدريبها أولًا باستخدام معلومات موسومة بملاحظات شارحة.

يتطلب تدريب نماذج التعلُّم العميق كميات هائلة من البيانات الموسومة. وعلى حد قول كايسي جرين، المتخصص في علم الأحياء الحاسوبي من جامعة بنسلفانيا في فيلادلفيا، فإن توفُّر هذه البيانات ليس بالسهل. ويضيف قائلًا: "إنّ تكلفة البيانات زهيدة، أما البيانات الموسومة، فهي تكبد تكاليف باهظة".

يزخر عالم الدراسات الجينومية بالتسلسلات الجينية، وهي متاحة للجميع، غير أن الشروح المصاحِبة لها، أو البيانات التوصيفية لها، كثيرًا ما لا تتوفر، أو تكون خاطئة، أو غير مستوفية للمعايير، على حد تعبير إيميلي فلين، المرشحة للدكتوراة في مجال نُظُم المعلومات الطبية الحيوية بجامعة ستانفورد بكاليفورنيا. وعلى سبيل المثال.. إذا رغب أحد الباحثين في تدريب أحد نماذج التعلم العميق على رصد سرطان الرئة ذي الخلايا غير الصغيرة في عينات من مرضى، فقد يعثر على مجموعات بيانات سابقة موسومة كالتالي "nsclc" (اختصارًا لسرطان الرئة ذي الخلايا غير الصغيرة)، أو تحمل الوسم المكتوب فيه "ذو خلايا غير صغيرة"، أو "سرطان رئة ذو خلايا غير صغيرة"، وهي اختلافات تربك أدوات التحليل، أو قد تحمل العينات واسمة باسم "ورم أرومي دبقي"، أو "إيجابية للمرض"، على حد ما ذكره كولين ديوي، المتخصص في علم الإحصاء الحيوي من جامعة ويسكونسن ماديسون.

وللمساعدة في تنظيم هذه البيانات، ابتكر ديوي سلاسل معالجة بيانات تسمى»ميتا إس آر إيه« MetaSRA، تستخدم تقنيات التنقيب في البيانات، بهدف مطابقة البيانات الوصفية المعلنة عن التسلسلات الجينية مع المعايير، وتخزين هذه البيانات. أما جرين وزملاؤه، فقد صمموا مستودع »ريفاين دوت بيو« refine.bio، وهو مستودع لتنسيق البيانات حول التعبير الجيني، وتسلسلات الحمض النووي الريبي. ويتعاون روس ألتمان -المتخصص في الهندسة الحيوية من جامعة ستانفورد- مع فلين، حيث يعملان على استخدام تقنيات تعلم الآلة؛ لاستنتاج الواسمات المفقودة في بيانات التعبير الجيني؛ لتحسين إضافة الواسمات الشارحة في مستودع »ريفاين دوت بيو«.

أما فيما يتعلق بتقنيات التصوير الحيوي، فتكمن المشكلة بدرجة أكبر في الواسمات. وعلى حد قول جرين، لوسم مجموعة من شرائح العرض المتعلقة بأمراض الأنسجة، "يجب أن يتدخل شخص، وأن يرسم مربعات حول الأجزاء المصابة بالسرطان". وهذا الشخص يجني -على الأرجح- الكثير من المال من جراء ذلك. من هنا.. أخذ مطورو البرمجيات اليوم في تدريب خوارزميات التعلم العميق على وسم النوى، وغير ذلك من البِنى في صور الخلايا. أما مستودع »إيمدج داتا ريسورس« Image Data Resource، وغيره من المستودعات، فمِن أجل التسهيل على الباحثين، للعثور على الصور في مجال علوم الحياة ومشاركتها.

وربما يحتاج الباحثون الذين يرغبون في استخدام مجموعات بيانات أكبر، أو تدريب نماذج أكثر تعقيدًا إلى شراء مصادر حاسوبية إضافية خارج نطاق خدمة «جوجل» المجانية، أو الوصول إلى هذه المصادر.

ويرىهنريكيس أن منصة «زيرو كوست دي إل فور ميك» هي بمثابة "بوابة" نحو الانغماس في عالم الذكاء الاصطناعي، وذلك من خلال تسهيل استخدام تقنيات التعلم العميق لعلماء الأحياء ذوي المعرفة القليلة بكتابة الأكواد ممن لا يملكون إلا موارد بسيطة، إذ تجذب المنصة الباحثين نحو استكشاف البرامج الكامنة وراء هذه الأدوات، التي ستستمر في إحداث تحوُّل في أبحاث السرطان وغيرها.

References

  1. von Chamier, L. et al. Preprint at bioRxiv https://doi.org/10.1101/2020.03.20.000133 (2020). 
  2. Perlman, Z. E. et al. Science 306, 1194–1198 (2004) | article
  3. Ljosa, V. et al. J. Biomol. Screen. 18, 1321–1329 (2013) | article
  4. Ando, D. M., McLean, C. Y. & Berndl, M. Preprint at bioRxiv https://doi.org/10.1101/161422 (2017). | article
  5. Warchal, S. J., Dawson, J. C. & Carragher, N. O. SLAS Discov. 24, 224–233 (2019). | article
  6. Warchal, S. J. et al. Bioorg. Med. Chem. 28, 115209 (2020) | article
  7. Ma, J. et al. Nature Meth. 15, 290–298 (2018) | article
  8. Ouyang, W. et al. Nature Meth. 16, 1254–1261 (2019) | article
  9. Poirion, O. B., Chaudhary, K., Huang, S. & Garmire, L. X. Preprint at medRxiv https://doi.org/10.1101/19010082 (2019). | article
  10. Torroja, C. & Sanchez-Cabo, F. Front. Genet. 10, 978 (2019) | article

إستر لاندهيوس صحفية مستقلة، متخصصة في مجال العلوم، تقيم بالقرب من مدينة سان فرانسيسكو، الواقعة بولاية كاليفورنيا.