ملخصات الأبحاث

سبر الاكتشافات المستقبلية الكامنة في مؤلفات علم المواد

V. Tshitoyan et al
  • Published online:

تُنشَر الغالبية العظمى من المعارف العلمية في صورة نصوص، وهو ما يجعل عملية تحليلها مهمة صعبة؛ سواء عن طريق التحليل الإحصائي التقليدي، أم أساليب تعلم الآلة الحديثة. وعلى النقيض من ذلك.. فإن المصدر الرئيس للبيانات التي يمكن تفسيرها آليا لمجتمع أبحاث المواد قد جاء من قواعد البيانات المهيكلة لخصائص المواد، التي لا تشمل سوى قدر ضئيل من المعارف الموجودة في المؤلفات البحثية. ولا يقتصر محتوى المنشورات البحثية على القيم المرتبطة بخصائص المواد فحسب، بل يحتوي أيضًا على معارف قيّمة تتعلق بالارتباطات بين بنود البيانات، والعلاقات فيما بينها كما فسرها المؤلفون.

وبغرض تحسين عملية تحديد هذه المعارف، واستخدامها، ركزت دراسات عديدة على استخلاص المعلومات من المؤلفات العلمية باستخدام المعالجة اللغوية الطبيعية الخاضعة لإشراف الإنسان، التي تتطلب مجموعات كبيرة من البيانات الموسومة يدويًا للتدرب عليها.

ويدلل الباحثون في البحث المنشور، على إمكانية إجراء ترميز يتسم بالكفاءة لمعارف علم المواد الموجودة في المؤلفات العلمية المنشورة وذلك في صورة تضمين لكلمات غنية بالمعلومات (تمثيل بالمتجهات للكلمات) دون الحاجة إلى توسيمها، أو الإشراف عليها من قبل الإنسان. وتعكس هذه التضمينات – دون إدراج واضح للمعارف الكيميائية بأي صورة – المبادئ المعقدة لعلم المواد؛ مثل البنية الكامنة وراء الجدول الدوري، والعلاقات بين بنية المواد وخصائصها. وبالإضافة إلى ذلك، يوضح الباحثون أن طريقة المعالجة غير الخاضعة لإشراف الإنسان يمكنها أن ترشح مواد للتطبيقات الوظيفية قبل اكتشافها بعدة سنوات. ويشير هذا إلى أن المعارف الكامنة ذات الصلة بالاكتشافات المستقبلية مضمنة - إلى حد كبير - في المنشورات البحثية السابقة.  

وتسلط نتائج الباحثين الضوء على إمكانية استخلاص المعارف والعلاقات من الكمية الهائلة من المؤلفات العلمية بطريقة جماعية، وتشير إلى نهج معمم للتنقيب في المؤلفات العلمية.