أخبار

الذكاء الاصطناعي يكتشف الصور المكررة في المسودات البحثية

بدأ بعض من جهات النشر في استخدام برامج حاسوبية تعمل أوتوماتيكيًا على اكتشاف الأخطاء في الأبحاث قبل نشرها.

ريتشارد فان نوردِن
  • Published online:
برامج الذكاء الاصطناعي التي ترصد الصور المكرَّرة في الأبحاث تعمل بسرعة أكبر وعلى نطاق أوسع، مقارنةً بعمليات المراجعة البشرية.

برامج الذكاء الاصطناعي التي ترصد الصور المكرَّرة في الأبحاث تعمل بسرعة أكبر وعلى نطاق أوسع، مقارنةً بعمليات المراجعة البشرية.

Credit: Laurence Dutton/Getty

قُبيل نشر دراسةٍ ما في أي من الدوريات العشر التي تَصدر عن الرابطة الأمريكية لأبحاث السرطان (AACR)، تخضع تلك الدراسة لتدقيق إضافي غير معتاد. فمنذ يناير من عام 2021، تستخدم الرابطةُ برامج الذكاء الاصطناعي للتدقيق في صحة جميع المسودات التي تعتمدها بصفة مبدئية بعد خضوعها لمراجعة الأقران. ويهدف هذا الإجراء إلى تنبيه المحرّرين تلقائيًا إلى وجود صور مُكرَّرة، بما في ذلك الصور التي تتضمن أجزاءً مقلوبة أو مستطالة أو جرى التلاعُب باتجاهها أو بتفاصيلها.

وتُعدّ الرابطةُ من أولى الكيانات التي تبنَّت هذا الإجراء الذي قد يصبح توجّهًا سائدًا. ونظرًا إلى رغبة كثير من الدوريات في تجنّب نشر أبحاثٍ تتضمَّن صورًا بها تلاعب -سواء بغرض الاحتيال الصريح أو محاولة تجميل عرض النتائج بطريقة غير مقبولة- عيَّن القائمون على تلك الدوريات أشخاصًا للاضطلاع بمهمة تدقيق المسودات الحثية قبل النشر، لاكتشاف ما بها من مشكلاتٍ. وينجز هؤلاء الأشخاص تلك المهمة عادة باستخدام برنامج حاسوبي يساعدهم على التحقق من صحة ما يقع بين أيديهم من نتائج بحثية. لكن دورية Nature علمت أن ما لا يقل عن أربعٍ من دور النشر بدأت بالفعل العام الماضي في تفعيل هذا الإجراء بصفة أوتوماتيكية عبر الاعتماد على برامج ذكاءٍ اصطناعي لرصد أي تكرارات، كليةً كانت أو جزئية، في المسودات البحثية قبل نشرها.

حول ذلك، يقول دانييل إيفانكو، مدير أنشطة الدوريات بالرابطة في فيلاديلفيا بولاية بنسلفانيا إن الرابطة الأمريكية لأبحاث السرطان جرَّبت منتجاتٍ برمجية كثيرة قبل أن تُقرِّر الاستعانة بخدمة تقدِّمها شركة «بروفيج» Proofig، في مدينة رحوفوت في إسرائيل. ويُضيف إيفانكو: "نحن راضون تمامًا عن هذه الخدمة". ويأمل أن تساعد عملية التدقيق تلك الباحثين وأن تقلل من المشكلات التي تظهر بعد النشر.

رغم ذلك، تظلّ الحاجة قائمةً إلى محررين محترفين يقرّرون ما ينبغي فعله عندما ينتبّه البرنامج إلى وجود أخطاء بصورٍ معيّنة. فعلى سبيل المثال، إذا عُرِضت مجموعاتٌ من البيانات مرتين عن قصدٍ -مع وجود تفسيراتٍ لذلك- فقد يكون تكرار الصور في محله. وربما ينتج بعض التكرارات عن أخطاءٍ بسيطة في النسخ واللصق في أثناء تجميع المسودة البحثية، دون أي شُبهةٍ لوجود احتيال. كل هذه المسائل لا يمكن حلّها سوى من خلال النقاش الذي يدور بين المحرّرين والمؤلفين. لكن مع تزايد كفاءة برامج الذكاء الاصطناعي وانخفاض تكلفتها، يتوقَّع المتخصِّصون أن تجتاح مجالَ النشر العلمي في السنوات القليلة القادمة موجةٌ من هذه البرامج تتخصص في التدقيق في صحة الصور، على النحو الذي أصبح به استخدام البرامج الحاسوبية لاكتشاف السرقات الفكرية في المسودات البحثية إجراءً روتينيًّا منذ عقدٍ مضى. وتصرِّح المؤسسات العاملة في مجال النشر أنها تعكف حاليًا على استكشاف طرقٍ للمقارنة بين الصور في المسودات البحثية على مستوى الدوريات المختلفة.

هل هذه حقبةُ البرامج الحاسوبية؟

يرحِّب خبراء آخرون في مجال سلامة الصور بهذا التوجّه الجديد، إلا أنهم ينوِّهون بأنّه لم تُعقَد مقارناتٌ علنية بين مختلف المنتجات البرمجية المتوفرة، ويحذِّرون من أن تُسفِر عملياتُ التدقيق التي تجري بصورة أوتوماتيكية عن اكتشافات خاطئة لكثير من المشكلات، أو تُخفق في رصد بعض أشكال التلاعب. وعلى المدى الطويل، قد يشجِّع الاعتماد على التدقيق الحاسوبي المحتالين على استخدام الذكاء الاصطناعي بدورهم للتحايل على برامج التدقيق، مثلما يلجأ بعضهم إلى تعديل النص بغرض الإفلات من عمليات التدقيق للكشف عن السرقات الفكرية. في ذلك الصدد، يقول بيرند بولفيرير، كبير المحررين في دورية «إي إم بي أوه ريبورتس» EMBO Reports، في هيدلبيرج، بألمانيا: "أشعر بالقلق كوننا مُقبلين على سباق تسلُّح بالتقنيات المعتمدة على الذكاء الاصطناعي قد يُفضي بنا إلى صور من التزييف العميق يستحيل اكتشافها".

وقد عكف باحثون على مدار سنواتٍ على تطوير تقنيات ذكاء اصطناعي متخصصة في التدقيق في صحة الصور بسبب مشكلات تتعلق بوجود أخطاء بحثية أو بعمليات احتيال بحثية، تنال على الأرجح من أصالة المؤلفات العلمية إلى حدٍ يفوق كثيرًا ما يوحي به العدد المحدود مما يُعلن عنه من تصحيح لنتائج الأبحاث وسحب للأوراق البحثية بعد نشرها. على سبيل المثال، في عام 2016، أوضح تحليلٌ بشري لنحو 20 ألف ورقة بحثية في مجال الطب الحيوي، قادته إليزابيت بيك، اختصاصية علم الأحياء الدقيقة وخبيرة تحليل الصور في ولاية كاليفورنيا، أن نسبةً كبيرة تصل إلى 4% من الأبحاث ربما تشتمل على تكرارات في غير محلها للصور (E. M. Bik et al. mBio 7, e00809-16; 2016). (في المعتاد، تبلغ نسبةُ الأبحاث التي تُجرى عليها تصحيحاتٌ نحو 1% سنويًّا، أما نسبة الأبحاث التي تُسحب بعد نشرها فأقل كثيرًا).

تعليقًا على ذلك، يقول مايك روسنر، الذي يدير شركة استشارات تدعى «إيمدج داتا إنتيجرتي» Image Data Integrity في سان فرانسيسكو بولاية كاليفورنيا، ويُعدُّ أول مَن طبَّق منهج التدقيق البشري في صحة المسودات البحثية في دورية «جورنال أوف سيل بيولوجي» Journal of Cell Biology، قبل 20 عامًا: "أعرف نحو 20 شخصًا يعملون على تطوير برامج لفحص الصور". وفي عام 2020، تعاونت دور نشر معًا لتُشكِّل مجموعة عمل تُعنى بوضع المعايير التي تحكم برامج التدقيق في صحة الأبحاث العلمية لاكتشاف المشكلات في صحة الصور، وأصدرت المجموعة العام الماضي إرشاداتٍ توجيهية للمحررين بخصوص كيفية التعامل مع الصور المُتلاعَب فيها، لكنها لم تُصدر بعد توجيهاتها بشأن البرامج الحاسوبية.

وقد أطلعت عدّة مجموعات أكاديمية وشركات دورية Nature بأن دوريات وهيئات حكومية تعكف حاليًا على تجريب برامج خاصة بها، لكن شركة «بروفيج» كانت أول شركة تعلن عن عملائها. فبجانب الرابطة الأمريكية لأبحاث السرطان، بدأت الجمعية الأمريكية للبحث الإكلينيكي (ASCI) في يوليو الماضي استخدام برنامج شركة «بروفيج» للتدقيق في صحة المسودات البحثية في دورية «جورنال أوف كلينيكال إنفستيجيشن» Journal of Clinical Investigation (JCI) ودورية «جيه سي آي إنسايت» JCI Insight، حسبما صرَّحت سارة جاكسون، المحرّرة التنفيذية لهاتين الدورتين، والمقيمة في آن أربور، بولاية ميشيجن. وإضافةً إلى ذلك، بدأت دار نشر «سايج» SAGE Publishing استخدام البرنامج في شهر أكتوبر الماضي في التدقيق في صحة خمسٍ من الدوريات التي تُصدرها في مجال علوم الحياة، وفقًا لما صرَّحت به هيلين كينج، رئيسة قسم التطوير لدى دار نشر «سايج» في لندن.

"أشعر بالقلق كوننا مُقبلين على سباق تسلُّح بالتقنيات المعتمدة على الذكاء الاصطناعي قد يُفضي بنا إلى صور من التزييف العميق يستحيل اكتشافها"

ويستخرج برنامج «بروفيج» الصور من الأبحاث العلمية ويقارنها في ثنائياتٍ، كي يكتشف السمات المشتركة بينها، بما في ذلك التكرارات الجزئية. ويستغرق التدقيق في البحث عادة دقيقة أو اثنتين، ويرصد البرنامج أيضًا أخطاءً دقيقة وخفية مثل «عيوب الانضغاط» التي تظهر عند ضغط البيانات الأولية عالية الوضوح في ملفاتٍ صغيرة الجحم، بحسب وصف درور كولودكين-جال، مؤسّس الشركة، الذي يضيف قائلًا: "يتفوَّق الحاسوب على الرؤية البشرية. فهو لا يكلّ ويعمل بسرعة أكبر كثيرًا. وعلاوةً على ذلك، لا يتأثَّر الحاسوب بأشكال التلاعب في الحجم والموقع والاتجاه، كما لا يتأثَّر بالتداخل والتكرار الجزئي، وأي حالاتٍ تجتمع فيها أكثر من واحدةٍ من تلك المشكلات".

وتكلفة التدقيق في صحة الصور أعلى بكثيرٍ من تكلفة التدقيق للكشف عن السرقات الفكرية، التي يقدِّرها المتخصِّصون بأقل من دولار أمريكي للبحث الواحد. وقد رفض كولودكين-جال مناقشة مسألة تسعير التدقيق في صحة الصور تفصيلًا، لكنه صرَّح بأن التكلفة تُحتسب في العقود التي تُبرم مع دور النشر على أساس عدد الصور في البحث الواحد، وحسب حجم المسودة البحثية أيضًا. وأضاف أن تكاليف التدقيق في صحة البحث الواحد تعادل "عشرات الدولارات، وليس مئات الدولارات".

وفي دورية «جيه سي آي»، تشير جاكسون إلى أن البرنامج رصد عددًا من الأخطاء يزيد عما اكتشفه في السابق طاقم العمل عبر المراجعة البشرية. بيد أن طاقم العمل لا يزال يضطلع بدور محوري في التدقيق في صحة نتائج برنامج «بروفيج». كما اتضحت أهمية أن يكون لدى الدورية منظومة إجراءات قائمة بالفعل للتعامل مع مختلف المشكلات المتعلِّقة بالصور. فتقول جاكسون: "نؤمن حقًّا بأن دقّة البيانات عاملٌ أساسي في تميُّز دورياتنا. ولذا قرَّرنا أن الأمر يستحق بذل الوقت والمال". ومن جانبه يشير إيفانكو، من الرابطة الأمريكية لأبحاث السرطان، إلى أن كثيرًا من الباحثين يسرهم تنبيههم إلى التكرارات المرصودة في أبحاثهم قبل نشرها.

من جهةٍ أخرى، ابتكرت دار نشر «فرونتيرز» Frontiers في لوزان بسويسرا برنامجًا خاصًا بها للتدقيق في الصور في إطار منظومة تدقيق آلية تُسمى «مساعد المراجعة القائم على الذكاء الاصطناعي» Artificial Intelligence Review Assistant (يُعرف اختصارًا بـ AIRA). ومنذ أغسطس من عام 2020، يستخدم فريقٌ داخلي مختص بسلامة الأبحاث هذه المنظومة للتدقيق في للصور الواردة في جميع المسودات البحثية قبل نشرها، حسبما صرح أحد المتحدثين الرسميين باسم «فرونتيرز». ومعظم الأبحاث التي تلفت هذه المنظومة الانتباه إليها لا تتضمن مشكلات بالفعل، فنحو 10% منها فقط يتطلَّب متابعة من جانب فريق سلامة الأبحاث. (امتنعت «فرونتيرز» عن التصريح بنسبة الأبحاث التي تحذر المنظومة من وجود أخطاء فيها).

ويفيد اختصاصيّو سلامة الصور، مثل بيك وروسنر، بأنهم لم يجرِّبوا بأنفسهم «مساعد المراجعة القائم على الذكاء الاصطناعي» أو برنامج «بروفيج»، كما يقولون إنه من الصعب تقييم منتجاتٍ برمجية لم تخضع لمقارناتٍ علنية باستخدام اختباراتٍ مقياسية. ويضيف روسنر أنه من المهم كذلك في الصور اكتشاف أشكال التلاعب الأخرى بخلاف التكرار، على غرار إزالة أو قص أجزاءٍ من الصور، وغيرها من أساليب التعديل باستخدام برنامج «فوتوشوب». ويستطرد قائلًا: "ربما يكون البرنامج أداةً مساعدة مفيدة للتدقيق البصري، لكنه بشكله الحاليّ قد لا يصلح بديلًا له".

ومن جانبها تُضيف بيك: "رغم ذلك، لدي قناعةٌ بأن هذا الفحص الآلي سيصبح في نهاية المطاف الإجراء المعتمد في التدقيق في صحة المسودات البحثية".

حذر من جانب جهات النشر

تعرب جهات النشر التي لم تتبن بعد التدقيق المعتمد على الذكاء الاصطناعي عن مخاوف تتعلّق بالتكلفة والموثوقية، رغم أن بعض هذه الجهات يعمل حاليًا على تطوير برامج ذكاء اصطناعي خاصة به. على سبيل المثال، صرَّح متحدث رسمي باسم دار نشر «بلوس» PLOS أن جهة النشر ترصد "بحماسٍ" التقدّم الذي يُحرز في مجال الأدوات القادرة بصورة موثوقة على "اكتشاف المشكلات الشائعة المتعلقة بسلامة الصور، والتي يمكن استخدامها على نطاق واسع". ومن جانبها، صرحت دار «إلسفير» Elsevier بأنها "لا تزال في طور تجريب" هذه البرمجيات، غير أنها تنوّه بأن بعضًا من الدوريات التي تنشرها تفحص جميع الأبحاث المعتمدة قبل النشر بغرض رصد أي مشكلاتٍ تتعلق بالصور "باستخدام مزيجٍ من الأدوات البرمجية والتحليل البشري".

"لدي قناعةٌ بأن هذا الفحص الآلي سيصبح في نهاية المطاف الإجراء المعتمد في التدقيق في صحة المسودات البحثية". 

وفي إبريل من عام 2020، بدأت دار نشر «وايلي» Wiley تبني خدمة التدقيق في صحة الصور مع جميع المسودات البحثية مؤقتًا، وهذه الخدمة يستخدمها حاليًا أكثرُ من 120 دورية، لكن الدار تعتمد حتى الآن على التدقيق البشري المدعوم بالبرمجيات، كما جاء على لسان أحد متحدّثيها الرسميين. وصرَّحت دار نشر «سبرينجر نيتشر» Springer Nature التي تنشر دورية Nature، أنها بصدد تقييم بعض الأدوات المنتَجة خارجها، في الوقت الذي تجمع فيه البيانات اللازمة لتدريب برنامجٍ خاص بها من المفترض أن "يجمع بين العنصر البشري والذكاء الاصطناعي التكميلي لرصد الصور التي تشتمل على أخطاء". (فريق الأخبار بدورية Nature مستقلٌ تحريريًا عن دار النشر).

ويشير بولفيرير إلى أن منصة «إي إم بي أوه برس» EMBO Press للنشر لا تزال تستخدم المراجعة البشرية في معظم الأحيان، لأنه لم يقتنع بعد بنسبة العائد من التكلفة الخاصة بالعروض التجارية لهذه التقنية، ولأنه عضو في مجموعة عمل تضم عددًا من دور النشر التي تعمل إلى الآن على وضع معايير تَحكُم هذه البرمجيات. غير أنه يضيف: "ليس لدينا شكٌ في أننا سنمتلك أدوات عالية الكفاءة قريبًّا".

ويخشى بولفيرير أن يتنبه المحتالون إلى الطريقةَ التي تعمل بها هذه البرامج، ومن ثمَّ يستخدمون الذكاء الاصطناعي في تزييف صورٍ يعجز البشر والبرامج الحاسوبية على حدٍ سواء عن اكتشافها. ورغم أنه لم يثبُت حتى الآن ظهور صور كتلك في الأبحاث العلمية، أشارتْ مسوَّدةٌ بحثية نُشِرت على موقع «بيوآركايف» bioRxiv العام الماضي إلى إمكانية إعداد نسخ مُزيّفة من صورٍ حقل البيولوجيا، على غرار الصور الملتقطة بتقنية «لطخات ويسترن» western blots، بحيث يتعذر التفريق بينها وبين البيانات الحقيقية (C. Qi et al. Preprint at bioRxiv https:// doi.org/ghk99p; 2021).

لكنَّ طائفةً من الباحثين تعمل على حلّ تلك المشكلة. على سبيل المثال، إدوارد ديلب -اختصاصي علم الحاسوب من جامعة بيردو بمدينة ويست لافاييت، بولاية إنديانا- يقود فريقًا يعمل على اكتشاف الوسائط المزيفة باستخدام الذكاء الاصطناعي، في إطار برنامجٍ تموِّله «وكالة مشروعات الأبحاث المتقدمة الدفاعية الأمريكية» (DARPA)، ويُركِّز فريق ديلب على صور حقل البيولوجيا المُزيَّفة، مثل الصور المجهرية وصور الأشعة السينية.

التدقيق المُقارِن في الصور على مستوى الدوريات المختلفة

في الوقت الحاليّ، لا يزال التدقيق في صحة الصور القائم على الذكاء الاصطناعي يتناول كل مسودة بحثية على حدة، ولا يمتدّ ليشمل عدّة أوراق بحثية، فهذا من شأنه أن يعزز صعوبة المهام الحاسوبية وتعقيدها. غير أن مطوِّري البرامج الحاسوبية في الأوساط التجارية والأكاديمية يرون أن هذه المراجعة قابلة للتنفيذ من الناحية التقنية. ففي عام 2020، استخدم دانييل أكونيا، اختصاصي علم الحاسوب من جامعة سيراكيوز بنيويورك، برنامجًا من ابتكاره لفحص الآلاف من مُسوِّدات ما قبل النشر لأبحاث بخصوص «كوفيد-19» لرصد أي تكرار للصور.

أما وكالة «كروسريف» Crossref -وهي نتاج مشروعٌ تعاونيّ غير هادف للربح يضم أكثر من 15 ألف مؤسسة، وينظّم عمليات التدقيق للكشف عن السرقات الفكرية على مستوى الأبحاث، ومقرّه الولايات المتحدة- فتُجرِي حاليًّا استبيانًا لمعرفة ما يساور أعضاؤها من مخاوف بشأن التلاعب في الصور، ونوعية البرامج التي يستخدمونها، وما إذا كان توفُّر "خدمة تدقيق تشمل جهات نشر مختلفة" وتتضمَّن مشاركةً للصور يُعدّ عمليًّا ومفيدًا، حسبما صرَّح براين فيكيري، مدير المنتج بوكالة «كروسريف»، في لندن.

وفي شهر ديسمبر الماضي، صرَّحت شركة «إس تي إم سولوشنز» STM Solutions -وهي شركة تابعة لمجموعة «إس تي إم» STM، التي تضمّ عددًا من دور النشر الأكاديمية، ومقرّها أوكسفورد بالمملكة المتحدة- أنها تعمل على تطوير "بيئةٍ سحابية" لتيسير التعاون بين جهات النشر في "التدقيق في صحة المقالات البحثية المُقدَّمة، بحثًا عن مشكلاتٍ تتعلّق بسلامة الأبحاث ونزاهتها"، في الوقت الذي تُراعي فيه الخصوصية والسرية. وعلى حد قول مات مكاي، أحد المتحدثين الرسميين باسم شركة «إس تي إم»، فإن اكتشاف التلاعب في الصور أو تكرارها أو السرقات الفكرية على نطاق الدوريات المختلفة "من الأولويات التي تتصدَّر خارطة طريق الشركة".