فك شفرة آليات الاختراق الهرمي وعلاقات الربط لمخاطر السلامة في بناء البنية التحتية للنقل الكبرى باستخدام تعدين النصوص والشبكات المعقدة
Unraveling hierarchical penetration mechanisms and coupling relationships of safety risks in major transportation infrastructure construction using text mining and complex networks

المجلة: Scientific Reports، المجلد: 16، العدد: 1
DOI: https://doi.org/10.1038/s41598-026-37778-3
PMID: https://pubmed.ncbi.nlm.nih.gov/41639222
تاريخ النشر: 2026-02-04
المؤلف: Wei Liu وآخرون
الموضوع الرئيسي: أبحاث الصحة والسلامة المهنية

نظرة عامة

تستكشف هذه الدراسة آليات الاختراق الهرمي والعلاقات المتبادلة بين عوامل الخطر التي تساهم في حوادث السلامة في البنية التحتية للنقل الكبرى. من خلال استخدام تقنيات استخراج النصوص ونظرية الشبكات المعقدة، تكشف الأبحاث أن الحوادث ليست نتيجة لعوامل معزولة بل تنبع من التفاعلات بين أوجه القصور التنظيمية، ونقاط الضعف الإشرافية، والأخطاء التشغيلية. تحدد النتائج الرئيسية العقد عالية MCGM، مثل أوجه القصور في إدارة السلامة (L4R8) وضعف الوعي بالسلامة (L2R10)، كمصادر خطر أساسية تؤدي إلى آثار متتالية عبر مستويات مختلفة من الهيكل التنظيمي. تعزز الدراسة نموذج HFACS وتقدم طريقة تحقق مزدوجة المؤشرات، مما يبرز عدم كفاية أساليب إدارة السلامة التقليدية التي تركز فقط على التصحيحات التشغيلية.

الإطار التحليلي الثلاثي المقترح—الذي يدمج استخراج النصوص، نموذج HFACS، ونظرية الشبكات المعقدة—يعالج التحيزات المعرفية الموجودة في المقابلات التقليدية مع الخبراء. يسمح بإجراء تعديلات مرنة على الفئات الفرعية بناءً على الخصائص الخاصة بالصناعة ويؤسس نظامًا للوقاية والسيطرة من ثلاثة مستويات: “مراجعة BIM المسبقة → التقييم الديناميكي → مراقبة IoT.” يوفر هذا الإطار مسارًا تقنيًا قابلًا للتكرار لإدارة المخاطر بشكل استباقي في الصناعات عالية المخاطر. ومع ذلك، تعترف الدراسة بالقيود، بما في ذلك التركيز الجغرافي للعينة والطبيعة الثابتة لنموذج الشبكة، مما يشير إلى أن الأبحاث المستقبلية يجب أن تشمل مجموعة أوسع من الحالات وتطوير شبكات مخاطر ديناميكية لتعزيز قابلية تعميم النتائج وتطبيقها عبر قطاعات مختلفة.

النتائج

في هذه الدراسة، تم تحليل مجموعة من 244 تقريرًا عن حوادث السلامة من مشاريع البناء الكبرى للبنية التحتية للنقل باستخدام تقنيات استخراج النصوص. تم معالجة التقارير في بايثون باستخدام قائمة كلمات توقف مخصصة ومفردات متخصصة، مع استخدام Jieba لتقسيم الكلمات. في البداية، تم تحديد 143 مصطلحًا مميزًا بناءً على قيم TF-IDF الخاصة بها؛ ومع ذلك، كان من الضروري إجراء فحص يدوي لاستبعاد المصطلحات التي لم تشير بشكل محدد إلى أسباب الحوادث، مثل “البناء”، “التنفيذ”، و”الحادث”. أسفر هذا العملية عن مجموعة مصفاة من 101 ميزة رئيسية لمزيد من التحليل.

لتصور النتائج، تم إنشاء سحابة كلمات، تبرز الأهمية النسبية لسلوكيات وعوامل مختلفة مرتبطة بأسباب الحوادث. تم تمثيل المصطلحات الموجودة في وسط سحابة الكلمات، مثل “الإشراف”، “الإدارة غير الكافية في الموقع”، و”التدريب”، بأحجام خط أكبر وألوان أغمق، مما يدل على أهميتها في سياق الحوادث التي تم تحليلها. يساعد هذا التصور في فهم العوامل الحرجة التي تساهم في حوادث السلامة في بيئات البناء.

المناقشة

في هذا القسم، تناقش الأبحاث المنهجية والنتائج المتعلقة بإدارة مخاطر السلامة في حوادث البناء الكبرى للبنية التحتية للنقل في الصين من 2010 إلى 2023. تم تحليل ما مجموعه 244 تقريرًا عن الحوادث، مع التركيز على الميزات الرئيسية المستخرجة من خلال تقنيات استخراج النصوص. استخدمت الدراسة نموذج HFACS المعدل لتصنيف أسباب الحوادث إلى أربعة مستويات: التأثيرات التنظيمية، الإشراف غير الآمن، الشروط المسبقة للأفعال غير الآمنة، والأفعال غير الآمنة. يسمح هذا النموذج المحسن بفهم أكثر دقة للعلاقات المتبادلة بين عوامل الخطر المختلفة، خاصة في سياق سلامة البناء.

شمل عملية استخراج النصوص عدة خطوات، بما في ذلك بناء مجموعة البيانات، والمعالجة المسبقة للنصوص، واستخراج الميزات الرئيسية باستخدام طريقة تكرار المصطلح – تكرار الوثيقة العكسية (TF-IDF). تم أيضًا استخدام تحليل شبكة التواجد المشترك لتحديد عوامل الخطر المهمة وعلاقاتها، باستخدام مقاييس مثل مركزية الدرجة وPageRank لتقييم أهمية العقد داخل الشبكة. قدمت الدراسة أيضًا نموذج الجاذبية متعدد الخصائص (MCGM) لتعزيز تحديد العقد المؤثرة في الشبكات المعقدة، من خلال دمج ميزات متعددة لتحسين الدقة. تؤكد النتائج على ضرورة وجود إطار إدارة مخاطر مصمم خصيصًا يعكس الخصائص الفريدة لمشاريع البنية التحتية للنقل، مما يؤدي في النهاية إلى تصنيف 35 عامل خطر متميز لإدارة السلامة بشكل فعال.

Journal: Scientific Reports, Volume: 16, Issue: 1
DOI: https://doi.org/10.1038/s41598-026-37778-3
PMID: https://pubmed.ncbi.nlm.nih.gov/41639222
Publication Date: 2026-02-04
Author(s): Wei Liu et al.
Primary Topic: Occupational Health and Safety Research

Overview

This study investigates hierarchical penetration mechanisms and the interrelationships among risk factors contributing to construction safety accidents in major transportation infrastructure. By employing text mining and complex network theory, the research reveals that accidents are not the result of isolated factors but rather stem from the interactions between organizational deficiencies, supervisory vulnerabilities, and operational errors. Key findings identify high-MCGM nodes, such as Safety Management Deficiencies (L4R8) and weak safety awareness (L2R10), as core risk sources that trigger cascading effects across different levels of the organizational structure. The study enhances the HFACS model and introduces a dual-indicator cross-validation method, emphasizing the inadequacy of traditional safety management approaches that focus solely on operational corrections.

The proposed tripartite analytical framework—integrating text mining, the HFACS model, and complex network theory—addresses cognitive biases found in conventional expert interviews. It allows for flexible adjustments to subcategories based on industry-specific characteristics and establishes a three-tier prevention and control system: “BIM pre-review → dynamic assessment → IoT monitoring.” This framework provides a replicable technical pathway for proactive risk management in high-risk industries. However, the study acknowledges limitations, including the geographical concentration of the sample and the static nature of the network model, suggesting future research should incorporate a broader range of cases and develop dynamic risk networks to enhance the generalizability and applicability of the findings across different sectors.

Results

In this study, a corpus of 244 safety accident reports from major transportation infrastructure construction projects was analyzed using text mining techniques. The reports were processed in Python with a customized stop word list and specialized vocabulary, employing Jieba for word segmentation. Initially, 143 feature terms were identified based on their TF-IDF values; however, manual screening was necessary to eliminate terms that did not specifically indicate accident causation, such as “construction,” “implementation,” and “accident.” This process resulted in a refined set of 101 key features for further analysis.

To visualize the findings, a Word Cloud was generated, highlighting the relative importance of various behaviors and factors associated with accident causation. Terms positioned centrally in the Word Cloud, such as “supervision,” “inadequate on-site management,” and “training,” were represented with larger font sizes and darker colors, indicating their significance in the context of the analyzed accidents. This visualization aids in understanding the critical factors contributing to safety incidents in construction environments.

Discussion

In this section, the research discusses the methodology and findings related to safety risk management in major transportation infrastructure construction accidents in China from 2010 to 2023. A total of 244 accident reports were analyzed, focusing on key features extracted through text mining techniques. The study employed a modified Human Factors Analysis and Classification System (HFACS) model to categorize accident causes into four levels: organizational influences, unsafe supervision, preconditions for unsafe acts, and unsafe acts. This improved model allows for a more nuanced understanding of the interrelationships among various risk factors, particularly in the context of construction safety.

The text mining process involved several steps, including corpus construction, text preprocessing, and key feature extraction using the Term Frequency-Inverse Document Frequency (TF-IDF) method. Co-occurrence network analysis was also utilized to identify significant risk factors and their relationships, employing metrics such as degree centrality and PageRank to evaluate node importance within the network. The study further introduced a Multi-Characteristic Gravity Model (MCGM) to enhance the identification of influential nodes in complex networks, integrating multiple features to improve accuracy. The findings underscore the necessity of a tailored risk management framework that reflects the unique characteristics of transportation infrastructure projects, ultimately leading to the classification of 35 distinct risk factors for effective safety management.