أنباء وآراء

تتبُّع انتشار مرض «كوفيد-19» باستخدام بياناتٍ ضخمة ونماذج بسيطة 

قد يساعدنا فهْم ديناميات عدوى فيروس "سارس-كوف-2" على الحدّ من انتشاره. وفي هذه الدراسة، تتوفر لنا طريقةٌ لنمذجة مخاطر العدوى، وتفسير التفاوت في حالات الإصابة بها، عن طريق تحليل بيانات الهواتف المحمولة، لتتبُّع التعاملات بين البشر في الأماكن المختلفة بالمدن.

كيفين سي. ما، ومارك ليبسيتش 

  • Published online:

إنَّ الخلافات حول تدابير مكافحة مرض "كوفيد-19"، التي تتعرض لقدرٍ كبيرٍ من التسييس، تكمن وراءها رغبةٌ مشتركة بين الكثيرين في إعادة الحياة الاقتصادية والاجتماعية إلى مستوياتها المستدامة، بأسرع ما يُمكن ولأطول فترةٍ ممكنة، مع الحفاظ على أنظمة الرعاية الصحية في الوقت نفسه، وتقليل حالات المرض الحادة وحالات الوفاة. ويتمحور الجدل الرئيس في هذه المسألة حول الدرجة التي يُعزِّز بها كلٌّ من هذه الأهداف تحقيق بقية الأهداف الأخرى، وما إذا كان لا بد من أن نقبل بزيادة انتقال العدوى لزيادة النشاط الاقتصادي والاجتماعي، أم لا. وجهود البحث عن طرق جديدة لنمذجة تفشي المرض تحفزها المصاعب التي تعترض تحديد ما يتسم بالفعالية، وما لا يسبب في الوقت نفسه إلا أدنى حد ممكن من الاضطرابات في حياتنا فيما يخص مكافحة الجائحة. ونظرًا إلى قلة ما تتيحه لنا الدراسات الوبائية من بياناتٍ عن قدرة التدخلات المختلفة على كبح انتشار العدوى، يمكن أن توفر مثل هذه النمذجة إطارًا مبدئيًّا لتقييم تدابير المكافحة المقترَحة، وأن تساعد على توجيه القرارات المتعلقة بسياسات التصدي للجائحة.

وفي بحثٍ نُشِرَ مؤخرًا بدورية Nature، قدَّمت الباحثة سيرينا تشانج وزملاؤها1 طريقة نمذجة مبتكرة، تدمِج بين النماذج البسيطة لانتشار الأمراض المُعدية، وبياناتٍ خاصة بتحركات الأفراد مستمدَّة من سجلات هواتفهم المحمولة. وقد مكَّنهم هذا النموذج الغني بالبيانات من وضع فرضياتٍ عن أماكن انتقال الفيروس فيما بين الأفراد، وعن كيفية نشوء التفاوت العِرقي والاجتماعي الاقتصادي في حالات الإصابة بعدوى "كوفيد-19"، والمدى المحتمل لفعالية الأنواع المختلفة من تدابير مكافحة المرض. كما أتاح لهم نموذجهم اختبار هذه الفرضيات إلى حدٍّ ما.

فقد حلَّلت تشانج وزملاؤها مجموعة بيانات مستمدة من سجلات الهواتف المحمولة الخاصة بثمانية وتسعين مليون شخص في الولايات المتحدة. وتوفر مجموعة البيانات هذه معلوماتٍ عن الأماكن التي وُجد فيها هؤلاء الأشخاص من الأول من مارس، حتى الأول من مايو في عام 2020، دون الإفصاح عن هويّاتهم. كما تشتمل البيانات على أكثر من 5 مليارات نقطة زمنية. وقد حلل مؤلفو الدراسة الأنماط العامة للتفاعلات البشرية في الأماكن غير السكنية محل الاهتمام، مثل المتاجر (الشكل 1)، والمطاعم، ودور العبادة. واستخدموا هذه البيانات كمُعاملاتٍ في نموذجهم لتوقُع أعداد حالات الإصابة الجديدة المُكتشفة في مُدنٍ بأكملها يوميًّا. كما "وفَّق" الباحثون بين نموذجهم، والبيانات التي تشير إلى أعداد الحالات الفعلية (قدَّروا بعض المعاملات الإضافية المجهولة). وبعد عملية التوفيق هذه، لم يعد النموذج يُقدِّر معدل العدوى الإجمالي فحسب، بل أيضًا معدلات العدوى في الأماكن المختلفة، كلّ على حدة، وفي كل نوعٍ من هذه الأماكن. وبهذا، تُعَد هذه الطريقة مكملًا للنهج الأكثر شيوعًا في مجال علم الوبائيات وجهود رصد انتشار الأمراض، التي تحاول تقدير مخاطر كل نوعٍ من الأنشطة على اختلافها بمفرده2،3.   

الشكل 1 | متجر بقالة في مدينة شيكاغو بولاية إلينوي الأمريكية. التُقِطَت الصورة في شهر إبريل من عام 2020.

الشكل 1 | متجر بقالة في مدينة شيكاغو بولاية إلينوي الأمريكية. التُقِطَت الصورة في شهر إبريل من عام 2020.

Credit: Kamil Krzaczynski/AFP/Getty

ومن حيث المبدأ، فإنَّ الدراسات التي تتناول حالات الانتشار العنقودي للمرض، أو بيانات تتبُّع مخالطي المصابين به، توفر طريقةً لتحديد أنواع الأنشطة والأماكن التي تنتقل فيها العدوى، أو يتعذر انتقالها نتيجةً للتدخلات المُطبَّقة. ومن الممكن استخدام الجوانب المشتركة لهذه النتائج في استنباط أيِّ الأنشطة يمكن أن يُسمح باستمرارها، وأيُّها ينبغي أن تركز عليه تدابير مكافحة المرض، فعلى سبيل المثال، تُظهِر دراسات الحالة الخاصة بحالات الانتشار العنقودي للعدوى في أماكن معينة، مثل السفن، ودور الرعاية، ومواقع مثل القاعات المغلقة المخصصة لتدريبات الغناء الجماعي، أنَّ الأماكن المزدحمة سيئة التهوية يزداد فيها خطر الإصابة بالمرض. وعلى العكس، فإنَّ دراسات الحالة الأخرى -مثل تلك التي وفرت أمثلةً من نتائج فحوص كشفت عدم انتقال العدوى إلى الزبائن من العمال المصابين في صالونات العناية بالشعر، في حال ارتداء الجميع للكمامات4- قدَّمت بعض الدعم لإعادة فتح مثل هذه الأماكن، بشرط تطبيقها للسياسات المقبولة لارتداء الكمامات.

صحيحٌ أنَّ هذه المقارَبات المعتمِدة على دراسات الحالة ضرورية، لكنَّها تعاني أوجه قصور كبيرة، إذ يكون حجم عيّناتها غالبًا صغيرًا5، كما أنَّها تكتفي عادةً بفحص عددٍ محدود من مخالطي مَن تتأكد إصابتهم بعدوى فيروس "سارس-كوف-2"، وهو ما يُصعِّب اكتشاف العوامل التي تُحدِّد إمكانية تفشي المرض. وفضلًا عن ذلك، في العديد من الأماكن، لا يُشكِّل ما يُكتَشَف من حالات الانتشار العنقودي للمرض وحالات العدوى عبر تتبُّع المخالطين سوى نسبةٍ متواضعة من إجمالي حالات انتقال المرض، ولذا، قد لا تتحقق إلا فائدة محدودة من تعميم الاستنتاجات المستمدة من هذه الأمثلة. وصحيحٌ أنَّ هناك نهجًا بديلًا، يتمثل في التجارب العشوائية الهادفة إلى تقييم تدخلات مكافحة العدوى، التي تُطبَّق فيها التدخلات على مجموعاتٍ سكانية مختلفة وفتراتٍ زمنية متقطعة6، غير أنَّه من الصعب إجراء مثل هذه التجارب7، ولم يُجرَ سوى عددٍ قليل جدًّا منها في حال مرض "كوفيد-19".

ونظرًا إلى قلة البيانات المتاحة من هذه الدراسات الوبائية والتجريبية، توفر لنا النمذجة الرياضية نهجًا مغريًا لتقييم التدخلات. ومع ذلك، فبدون البيانات التي توفرها الدراسات الوبائية، لا تستطيع دراسات النمذجة في أحسن الأحوال سوى أن تفترض النطاقات المحتملة لفعالية أنواع التدخلات المختلفة. وهنا تتجلى إحدى نقاط القوة في نهج تشانج وزملائها، إذ تستند تقديرات آثار التدخلات فيه إلى المعدلات التي تشير إليها نمذجة انتقال العدوى في الأماكن المختلفة. وهذه المعدلات بدورها تستند إلى بيانات الهواتف المحمولة المتعلقة بمواقع الأشخاص، التي توفر معلوماتٍ معينة، مثل عدد الأشخاص الذين يخالطون بعضهم بعضًا عن قُربٍ في مكانٍ معين. كما أنَّ هذه المعدلات تُستَخدم إلى جانب افتراضاتٍ مقنِعة وواضحة عن العوامل المسببة لانتقال العدوى في أنواع الأماكن المختلفة.

وتتيح البيانات التي استخدمتها تشانج وزملاؤها تقديراتٍ مفصلة لعدد الأشخاص الذين يزورون الأماكن المختلفة في كل ساعة، ومتوسط المدة التي يبقون فيها هناك، والأحياء التي يتوافدون منها. وقد صُمِّم نموذج انتقال العدوى بحيث يُصنِّف الأشخاص في كل حي حسب حالتهم المَرَضية: أي ما إذا كانوا مُعرَّضين للعدوى (لم يُصابوا من قبل)، أم حاملين لها (لكنْ لم يكتسبوا بعد القدرة على نقلها)، أم مُصابين بها (وقادرين على نقلها)، أم مستثنين (تعافوا من المرض، أو أدّى إلى وفاتهم). وبهذا، تُعَد هذه التصنيفات تقريبًا ملائمة لما يُسمَّى اختصارًا بنموذج SEIR (الأحرف الأولى من اسم كل فئة حالة مرضية). كما يسمح نموذج الباحثين بانتقال الأفراد من فئةٍ إلى أخرى من هذه الفئات بالترتيب.

ويتمثل الافتراض الرئيس الذي تطرحه تشانج وزملاؤها في أنَّ معدل احتمالية إصابة الناس في مجتمعٍ سكاني بالمرض، والذي يشير في هذا السياق إلى انتقالهم من فئة "المُعرَّضين للعدوى" إلى فئة "الحاملين لها"، يعتمد على الأماكن التي يزورونها، وتغيُّرها مع مرور الوقت. وفي هذا النموذج، تزداد احتمالية الإصابة في الأماكن التي يمكث فيها الناس وقتًا أطول، وتكون أكثر ازدحامًا، مقارنةً بالأماكن التي يقضون فيها وقتًا أقصر، ويقل فيها الازدحام. وهذا النموذج الذي يقوم عليه تحليلهم بسيطٌ إلى حد استثنائي، غير أنَّ المعلومات عن طبيعة التغيرات السلوكية للسكان مع مرور الوقت تزوده بها البياناتٍ التفصيلية عن تنقلات الأفراد.     

وإحدى نقاط القوة أيضًا في نهج النمذجة الغني بالبيانات، الذي استخدمه الباحثون، هي أنَّه لا يوجد سوى عددٍ قليل من المعاملات المجهولة التي يلزم تقديرها بما يناسب النموذج، وهو ما يُقلِّل خطر التوفيق بين النموذج والبيانات الفعلية إلى حد مفرط يجبر بِنْيته على أن تضع في الاعتبار السمات الأساسية للبيانات. وبعد التوفيق بين المعاملات، والبيانات المتاحة للجمهور عن عدد حالات الإصابة اليومية، وجدت تشانج وزملاؤها أنَّ نموذجهم بإمكانه أن يتنبأ بدقةٍ أكبر بتطورات تفشي الوباء المرصودة في عدة مدن، إذا قورنت نتائجه بنتائج النماذج التي تفتقر إلى مثل هذه البيانات التفصيلية عن تنقلات الناس. ويشير هذا إلى أنَّ إضافة تلك البيانات زادت دقة نموذجهم. صحيحٌ أنَّ الهدف من نهج النمذجة هذا الذي يركز على آليات انتشار المرض لم يكن الإدلاء بأي توقعاتٍ لتفشي الوباء8، لكنَّ محاولة استنباط أي استنتاجات بشأن الآليات المحتملة المسببة لأنماط التفشي المرصودة تتطلب عادةً في البداية تأكيد تمتُّع النموذج بقدرةٍ مقبولة على أن يضع توقعاتٍ دقيقة.

وبالإضافة إلى تجربة أساليب بديلة للتوفيق بين النموذج والبيانات، حلَّل مؤلفو الدراسة مدى تأثر النتائج المختلفة لنموذجهم بمعاملاته، ووجدوا أنَّ مخرجات النموذج تظل متسقةً على مدى القِيَم المحتملة للمعاملات. وبهذا تؤكد لنا هذه المُخرَجات أنَّ الفرضيات التي يقوم عليها النموذج، رغم بساطتها، تُسفِر عن توقعاتٍ أكثر دقة من حيث ملاءمتها للبيانات، مقارنة بتوقعات الفرضيات الأخرى التي تبدو معقولةً بالقدر ذاته، وهو ما يعزز اقتناعنا بصحة فرضيات الباحثين عن التدخلات. ومن المهم متابعة هذه الدراسة بالتحقُّق ممَّا إذا كانت نتائج النموذج تتسق كذلك مع بيانات أعداد الحالات في الأشهر الأخيرة، ومن بينها بيانات الزيادات الحادة المفاجئة في أعداد الحالات التي رُصدت خلال الصيف في بعض المدن.

"تضطلع المطاعم، وصالات الألعاب الرياضية، ودور العبادة بدورٍ كبير للغاية في زيادة معدلات الإصابة، مقارنةً بغيرها".

ويتوقع نموذج تشانج وزملائها أنَّ حالات العدوى في أماكن مثل المطاعم، وصالات الألعاب الرياضية، ودور العبادة تضطلع بدورٍ كبير للغاية في زيادة معدلات الإصابة، مقارنةً بغيرها، وهو ما يدعم النتائج المُستخلَصة من الدراسات الوبائية5،9، غير أنَّ المواقع التي أغفلها تحليل تشانج وزملائها تُبرِز بعضًا من أوجه القصور في تحليلات بيانات التنقُّلات هذه، فالأطفال، وكبار السن، والسجناء لا يحظون بالتمثيل الكافي في مجموعات البيانات التي تستخدمها دراستهم، ولذا، تعذَّر الخروج باستنتاجاتٍ عن إسهام المدارس، ودُور الرعاية، والسجون في الانتشار المجتمعي للعدوى الفيروسية. وقد يمكن سد هذه الفجوة10 باستخدام نماذج تجمع بين بيانات التنقُّل، ومصادر البيانات الوبائية التقليدية، مثل استطلاعات الاختلاط الاجتماعي.

ومع ذلك، فبيانات التنقُّل الخاصة بالأماكن التي حلَّلها مؤلفو الدراسة اتسمت بالتفصيل الشديد، وهذا مكَّنهم من تقييم عدة استراتيجيات لاستئناف الأنشطة تختلف عن بعضها بعضًا اختلافاتٍ طفيفة، بدلًا من أن يكتفوا بنمذجة الوضع في حال تخفيض النشاط والحركة بشكلٍ عام في المدن التي تحاول مواجهة الجائحة. وقد وجد الباحثون في تقييمهم أنَّ استراتيجية تحديد نسبة الإشغال القصوى في الأماكن المختلفة، التي تُقلِّل ضمنيًّا عدد الساعات التي يقضيها الشخص في الأماكن الخطيرة المزدحمة، من المتوقع أن تؤدي إلى انخفاض عدد حالات الإصابة الجديدة، مُقارنةً باستراتيجية تخفيض النشاط عمومًا، دون استهداف أماكن بعينها. ويمكن توسيع نطاق تطبيق نهج الباحثين أيضًا ليشمل تقييم أنواعٍ أخرى من استراتيجيات استئناف الأنشطة، وإنهاء حالة الإغلاق، فعلى سبيل المثال، قد يمكن نمذجة الوضع في حال تحديد مدد الزيارات إلى الأماكن، مثل صالات الألعاب الرياضية، والمتاحف، من خلال تقليل متوسط مدة الزيارة في النموذج.

وتساعدنا دراسة تشانج وزملائها كذلك على فهم المزيد عن الأسباب المحتملة للتفاوت المُلاحَظ في حالات الإصابة بمرض "كوفيد-19" حسب مستوى الدخل، الذي لم يُفهَم تمامًا إلى الآن، إذ جمع مؤلفو الدراسة بين نموذج التنقلات الذي أنشأوه، والبيانات الديموجرافية في الإحصاءات السكانية، واستطاعوا بذلك تحديد عاملَين رئيسَين محتملين من العوامل المُسهِمة في نشوء ذلك التفاوت: أولهما أنَّ الأحياء الأقل دخلًا، التي تضم غالبًا عددًا أكبر من العاملين في وظائف الخدمات الأساسية التي تتطلب تعاملًا مباشرًا مع الناس، انخفضت فيها حركة التنقل الإجمالية أثناء فترات الإغلاق بمقدارٍ أقل من الانخفاض الذي شهدته المناطق الأعلى دخلًا، وهو استنتاجٌ تتفق معه دراساتٌ أخرى11،12. أمَّا العامل الثاني المحتمل، فهو أنَّ الأماكن التي يزورها سكان الأحياء الأقل دخلًا تكون غالبًا أكثر اكتظاظًا من تلك التي يزورها سكان المناطق الأعلى دخلًا، وذلك على مستوى أنواعٍ مختلفة كثيرة من الأماكن. والتوصل إلى هذا النوع من الملاحظات لم يكن ليتحقق لولا التفاصيل شديدة الدقة المتوفرة عن أحجام الأماكن، ونِسَب الإشغال بها في البيانات التي حلَّلها الباحثون.

ويُقدم مؤلفو الدراسة في بحثهم فرضياتٍ واضحة، تَتعزَّز وجاهتها بتوافقها في النموذج مع بيانات العدوى المرصودة، وقلة المعامِلات المجهولة اللازم تقديرها في النموذج (وهو ما يُقلِّل المخاوف المتعلقة بفرط التوفيق بين النموذج والبيانات الفعلية)، وبقدرة هذه الفرضيات على توفير تفسيراتٍ لملاحظات لم تكن جزءًا من البيانات، مثل التفاوت المرتبط بمستوى الدخل. صحيحٌ أنَّنا نحتاج إلى إجراء مزيدٍ من الاختبارات على النموذج، لكن نظرًا إلى التحديات التي تواجهها جهود جمع أنواع البيانات الأخرى المهمة وتفسيرها، فإنَّ هذه النتائج يمكن أن تلعب دورًا مهمًّا في توجيه قرارات السياسة المتعلقة بكيفية استئناف الأنشطة المختلفة في المجتمعات بأمان، وأن تقلل أيضًا الضرر الناجم عن القيود المفروضة على التنقُّل والحركة إلى أقل حدٍّ ممكن. وبهذا، تبرز دراسة تشانج وزملائها قيمة دمج بيانات التنقُّل في منظومات الرصد الوبائي13، وهو نهجٌ يلقى قبولًا متزايدًا في الوقت الحالي، وينبغي أن يصبح إجراءً روتينيًّا ضمن سعينا لإعادة بناء منظومات الرصد هذه، لتأخذ في اعتبارها الدروس المستفادة من الجائحة الحالية.  

References

  1. Chang, S. et al. Nature 589, 82–87 (2021).  | article

  2. Lipsitch, M., Swerdlow, D. L. & Finelli, L. N. Engl. J. Med. 382, 1194–1196 (2020). | article
  3. Lipsitch, M. et al. Biosecur. Bioterror. 9, 89–115 (2011). | article
  4. Hendrix, M. J., Walde, C., Findley, K. & Trotman, R. Morbid. Mortal. Wkly Rep. 69, 930–932 (2020). | article
  5. Fisher, K. A. et al. Morbid. Mortal. Wkly Rep. 69, 1258–1264 (2020). | article
  6. Haushofer, J. & Metcalf, C. J. E. Science 368, 1063–1065 (2020). | article
  7. Kennedy-Shaffer, L. & Lipsitch, M. Am. J. Epidemiol. 189, 1324–1332 (2020). | article
  8. Holmdahl, I. & Buckee, C. N. Engl. J. Med. 383, 303–305 (2020). | article
  9. Leclerc, Q. J. et al. Wellcome Open Res. 5, 83 (2020). | article
  10. Chamie, G. et al. Clin. Infect. Dis. https://doi.org/10.1093/cid/ciaa1234 (2020). | article
  11. Zelner, J. et al. Preprint at medRxiv https://doi.org/10.1101/2020.09.10.20192369 (2020).
  12. Kissler, S. M. et al. Nature Commun. 11, 4674 (2020). | article
  13. Grantz, K. H. et al. Nature Commun. 11, 4961 (2020). | article

كيفن سي. ما، ومارك ليبسيتش

يعملان في قسم المناعة والأمراض المُعدية بكلية هارفارد تي. إتش. تشان للصحة العامة في بوسطن، ولاية ماساتشوستس 02115، الولايات المتحدة الأمريكية. كما يعمل ليبسيتش في مركز ديناميات الأمراض المُعدية، التابع لقسم الوبائيات في الكلية نفسها.

البريدان الإلكترونيان:

kevinchenma@g.harvard.edu

mlipsitc@hsph.harvard.edu