تصنيف المخاطر الأيضية لعمال النوبات الليلية في مكان عمل تجزئة كبير من خلال التجميع وتفسير SHAP
Metabolic risk stratification of night shift workers in a large retail workplace through clustering and SHAP interpretation

المجلة: Frontiers in Public Health، المجلد: 13
DOI: https://doi.org/10.3389/fpubh.2025.1704046
PMID: https://pubmed.ncbi.nlm.nih.gov/41602090
تاريخ النشر: 2026-01-12
المؤلف: InHo Lee وآخرون
الموضوع الرئيسي: النوم والإرهاق المرتبط بالعمل

نظرة عامة

تستكشف هذه الدراسة المخاطر الصحية الأيضية المرتبطة بالعمل في نوبات ليلية، باستخدام طرق الذكاء الاصطناعي القابلة للتفسير لتحديد وتصنيف هذه المخاطر بين العمال. أجريت الدراسة في شركة توزيع محلية كبيرة، حيث تم تحليل بيانات الفحص الصحي – بما في ذلك سكر الدم، الكوليسترول، وضغط الدم – إلى جانب عوامل ديموغرافية مثل العمر ومدة الخدمة. باستخدام تقنيات التعلم غير الخاضع للإشراف (UMAP وتجميع K-means)، حددت الدراسة أربع مجموعات صحية متميزة بين العمال في النوبات الليلية. تكشف النتائج أن المجموعة 0 تمثل مجموعة صحية منخفضة المخاطر، بينما تشير المجموعات 1 و2 و3 إلى درجات متفاوتة من المخاطر، حيث يكون العمال الأكبر سناً والذين لديهم خبرة أطول في العمل الليلي أكثر عرضة للخطر.

كما استخدمت التحليل نموذج الغابة العشوائية وشرح شابلي الإضافي (SHAP) لتحديد أهم العوامل الصحية التي تميز هذه المجموعات. تضمنت المحددات الرئيسية مؤشر كتلة الجسم (BMI)، مؤشر الدهون الثلاثية وسكر الدم، ضغط الدم، وطول الخدمة. تختتم الدراسة بأن المخاطر الصحية الأيضية بين العمال في النوبات الليلية غير متجانسة ويمكن تصنيفها بفعالية باستخدام تقنيات التعلم الآلي. توفر هذه الرؤى أساساً لتطوير استراتيجيات صحية صناعية مخصصة، مثل التدخلات الصحية الشخصية والجداول الزمنية المحسنة للعمل، مع التأكيد على الحاجة إلى رعاية صحية مستهدفة للمجموعات عالية المخاطر التي تم تحديدها في البحث.

مقدمة

تسلط المقدمة الضوء على المخاطر الصحية الكبيرة المرتبطة بالعمل في النوبات الليلية، والتي تؤثر على حوالي 15-30% من القوة العاملة العالمية. تشير الأبحاث إلى أن أنماط العمل هذه تساهم في مجموعة متنوعة من المشكلات الأيضية والقلبية الوعائية، بما في ذلك زيادة مخاطر احتشاء عضلة القلب، مرض الشريان التاجي، ارتفاع ضغط الدم، ومتلازمة الأيض. عوامل مثل اضطرابات إيقاع الساعة البيولوجية، عادات الأكل غير الصحية، والضغط النفسي تزيد من الضرر التأكسدي والاستجابات الالتهابية، مما يؤدي إلى حالات مثل داء السكري من النوع 2 والسمنة. يتم تقديم مفهوم “متلازمة الإيقاع البيولوجي” لتلخيص التحديات الصحية المتعددة الأوجه التي يواجهها العمال في النوبات، والتي تشمل ليس فقط الاضطرابات الأيضية ولكن أيضاً مشكلات الصحة النفسية مثل الاكتئاب والقلق.

تناقش المقدمة أيضاً الأطر التنظيمية، مثل توجيه ساعات العمل في الاتحاد الأوروبي، الذي يهدف إلى التخفيف من المخاطر الصحية المرتبطة بساعات العمل الطويلة. في المقابل، يثير نقص كوريا الجنوبية في تنظيمات محددة للنوبات الليلية، على الرغم من ساعات العمل المتوسطة الأطول مقارنة بمعايير منظمة التعاون والتنمية الاقتصادية، مخاوف بشأن إمكانية زيادة المخاطر الصحية. تهدف الدراسة إلى سد فجوة في الأبحاث الحالية من خلال تقديم تقييم شامل لمؤشرات الصحة المختلفة بين العمال في النوبات الليلية في بيئات البيع بالتجزئة الكبيرة، داعية إلى استراتيجيات إدارة متكاملة لتعزيز رفاهية العمال في النوبات.

طرق

يستعرض قسم “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. يوضح المواد المحددة المستخدمة، بما في ذلك أي مواد كيميائية، معدات، وعينات بيولوجية، لضمان إمكانية تكرار التجارب. تشمل المنهجية التقنيات المطبقة لجمع البيانات وتحليلها، مثل الاختبارات الإحصائية أو النماذج الحسابية، والتي تعتبر حاسمة للتحقق من النتائج.

بالإضافة إلى ذلك، قد يصف القسم الظروف التجريبية، بما في ذلك الضوابط والمتغيرات التي تم التلاعب بها خلال الدراسة. يضمن هذا النهج الشامل أن تكون النتائج قوية ويمكن تفسيرها في سياق أهداف البحث. بشكل عام، تعتبر وضوح ودقة الطرق ضرورية لمصداقية نتائج البحث.

نتائج

يقدم قسم “النتائج” في ورقة البحث النتائج الرئيسية المستمدة من التجارب أو التحليلات التي تم إجراؤها. يوضح نتائج الدراسة، مع تسليط الضوء على نقاط البيانات والاتجاهات المهمة التي تم ملاحظتها. غالباً ما يتم توضيح النتائج من خلال الجداول، الرسوم البيانية، أو المعادلات، التي توفر تمثيلاً بصرياً للنتائج.

قد يتضمن القسم أيضاً تحليلات إحصائية تتحقق من النتائج، مثل قيم p أو فترات الثقة، مما يشير إلى موثوقية البيانات. علاوة على ذلك، قد يتم مناقشة المقارنات مع الدراسات السابقة أو التوقعات النظرية لوضع النتائج في سياق مجال البحث الأوسع. بشكل عام، يخدم هذا القسم لنقل الاكتشافات الأساسية التي تم تحقيقها خلال الدراسة، مما يمهد الطريق للنقاشات والاستنتاجات اللاحقة.

نقاش

تحققت الدراسة من المخاطر الصحية الأيضية للعمال في النوبات الليلية في موقع توزيع في تشيونان، كوريا الجنوبية، مع التركيز على عينة نهائية من 219 موظفاً بعد استبعاد أولئك الذين لديهم حالات صحية موجودة مسبقاً. باستخدام مزيج من UMAP لتقليل الأبعاد وتجميع K-means، حددت الأبحاث ملفات تعريف مخاطر صحية متميزة بين المشاركين بناءً على عوامل مثل العمر، مدة العمل في النوبات، ومؤشرات أيضية متنوعة. أشار تحليل معامل الظل إلى أنه بينما قدم حل المجموعتين أعلى درجة، فإن نموذج الأربع مجموعات (k=4) قدم فهماً أكثر دقة لخصائص صحة المشاركين، مميزاً بين المجموعات منخفضة المخاطر، التعرض طويل الأمد، المخاطر المتوسطة، والمجموعات الشابة عالية المخاطر.

أظهر مصنف الغابة العشوائية أداءً تنبؤياً قوياً عبر كلا الحلين التجميعيين، مع دقة متوسطة تبلغ 97.6% لـ k=2 و89.7% لـ k=4، مما يؤكد استقرار المجموعات المحددة. كشف تحليل SHAP أن خبرة العمل في النوبات كانت عاملاً حاسماً عبر جميع المجموعات، بينما ميزت مؤشرات أيضية محددة مثل ضغط الدم ومستويات الدهون المجموعات بشكل أكبر. من الجدير بالذكر أن الدراسة سلطت الضوء على “مجموعة الشباب عالية المخاطر” التي تتميز بمخاطر أيضية عالية على الرغم من فترات العمل في النوبات القصيرة، مما يبرز الحاجة إلى تدخلات صحية مخصصة. بشكل عام، تؤكد النتائج على عدم تجانس المخاطر الأيضية ضمن سكان العمال في النوبات وتقترح أن استراتيجيات إدارة الصحة المخصصة ضرورية للتدخلات الصحية المهنية الفعالة.

القيود

تقدم الدراسة حول المخاطر الصحية الأيضية في العمال في النوبات عدة قيود يجب الاعتراف بها. أولاً، يقيّد التصميم العرضي القدرة على إقامة علاقات سببية بين العمل في النوبات والاضطرابات الأيضية. بالإضافة إلى ذلك، قد لا تكون النتائج قابلة للتعميم على صناعات أخرى، حيث ركزت الأبحاث فقط على مكان عمل واحد. إن الاعتماد على بيانات الاستبيانات المبلغ عنها ذاتياً يقدم تحيزاً محتملاً بشأن نوع العمل وخيارات نمط الحياة. علاوة على ذلك، بينما تم استخدام عامل الظل لتحديد عدد المجموعات، قد لا تكون هذه الطريقة كافية لالتقاط الأهمية السريرية لجميع المجموعات المحددة.

علاوة على ذلك، تثير حجم العينة المحدود مخاوف بشأن قوة دقة التقرير البالغة 87.9% من التحقق الاحتياطي لنموذج الغابة العشوائية. يمنع تركيز الدراسة حصرياً على العمال في النوبات الليلية التحليلات المقارنة مع العمال في النهار أو العمال في نوبات أخرى، مما يبرز الحاجة إلى أبحاث مستقبلية تشمل مجموعة أوسع من أنواع العمل. أخيراً، يحد غياب بيانات المتابعة طويلة الأجل حول النتائج مثل متلازمة الأيض أو حدوث الأمراض القلبية الوعائية من القدرة على تقييم ما إذا كانت المخاطر الصحية المحددة ضمن كل مجموعة تترجم إلى تطور فعلي للأمراض.

Journal: Frontiers in Public Health, Volume: 13
DOI: https://doi.org/10.3389/fpubh.2025.1704046
PMID: https://pubmed.ncbi.nlm.nih.gov/41602090
Publication Date: 2026-01-12
Author(s): InHo Lee et al.
Primary Topic: Sleep and Work-Related Fatigue

Overview

This study investigates the metabolic health risks associated with night shift work, utilizing explainable AI methods to identify and categorize these risks among workers. Conducted at a large domestic distribution company, the research analyzed health examination data—including blood sugar, cholesterol, and blood pressure—alongside demographic factors such as age and tenure. Employing unsupervised learning techniques (UMAP and K-means clustering), the study identified four distinct health clusters among night workers. The findings reveal that Cluster 0 represents a healthy low-risk group, while Clusters 1, 2, and 3 indicate varying degrees of risk, with older workers and those with longer night shift experience being particularly vulnerable.

The analysis further employed the Random Forest model and Shapley Additive Explanations (SHAP) to determine the most significant health factors distinguishing these groups. Key determinants included body mass index (BMI), triglyceride-blood sugar index, blood pressure, and length of service. The study concludes that metabolic health risks among night workers are heterogeneous and can be effectively classified using machine learning techniques. These insights provide a foundation for developing tailored industrial health strategies, such as personalized healthcare interventions and optimized work schedules, emphasizing the need for targeted health care for high-risk groups identified in the research.

Introduction

The introduction highlights the significant health risks associated with night and shift work, which affects approximately 15-30% of the global workforce. Research indicates that such work patterns contribute to various metabolic and cardiovascular issues, including increased risks of myocardial infarction, coronary artery disease, hypertension, and metabolic syndrome. Factors such as circadian rhythm disruptions, unhealthy eating habits, and mental stress exacerbate oxidative damage and inflammatory responses, leading to conditions like type 2 diabetes and obesity. The concept of “Circadian Syndrome” is introduced to encapsulate the multifaceted health challenges faced by shift workers, which include not only metabolic disturbances but also mental health issues such as depression and anxiety.

The introduction also discusses regulatory frameworks, such as the European Union Working Hours Directive, which aims to mitigate health risks associated with long working hours. In contrast, South Korea’s lack of specific regulations for night shifts, despite longer average working hours compared to OECD standards, raises concerns about the potential for increased health risks. The study aims to fill a gap in existing research by providing a comprehensive assessment of various health indicators among night workers in large retail settings, advocating for integrated management strategies to enhance the well-being of shift workers.

Methods

The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including any reagents, equipment, and biological samples, ensuring reproducibility of the experiments. The methodology encompasses the techniques applied for data collection and analysis, such as statistical tests or computational models, which are crucial for validating the findings.

Additionally, the section may describe the experimental conditions, including controls and variables manipulated during the study. This comprehensive approach ensures that the results are robust and can be interpreted within the context of the research objectives. Overall, the clarity and rigor of the methods are essential for the credibility of the research outcomes.

Results

The “Results” section of the research paper presents the key findings derived from the conducted experiments or analyses. It details the outcomes of the study, highlighting significant data points and trends observed. The results are often illustrated through tables, graphs, or equations, which provide a visual representation of the findings.

The section may also include statistical analyses that validate the results, such as p-values or confidence intervals, indicating the reliability of the data. Furthermore, comparisons with previous studies or theoretical predictions may be discussed to contextualize the findings within the broader field of research. Overall, this section serves to convey the essential discoveries made during the study, setting the stage for subsequent discussions and conclusions.

Discussion

The study investigated the metabolic health risks of night workers at a distribution site in Cheonan, South Korea, focusing on a final sample of 219 employees after excluding those with pre-existing health conditions. Utilizing a combination of UMAP for dimensionality reduction and K-means clustering, the research identified distinct health risk profiles among the participants based on factors such as age, shift work tenure, and various metabolic indicators. The silhouette coefficient analysis indicated that while a two-cluster solution provided the highest score, a four-cluster model (k=4) offered a more nuanced understanding of the participants’ health characteristics, distinguishing between low-risk, long-term exposure, moderate-risk, and young high-risk groups.

The Random Forest classifier demonstrated robust predictive performance across both clustering solutions, with mean accuracies of 97.6% for k=2 and 89.7% for k=4, confirming the stability of the identified clusters. SHAP analysis revealed that shift work experience was a critical factor across all clusters, while specific metabolic indicators such as blood pressure and lipid levels further differentiated the groups. Notably, the study highlighted a “young high-risk group” characterized by high metabolic risk despite shorter shift work tenures, emphasizing the need for tailored health interventions. Overall, the findings underscore the heterogeneity of metabolic risks within the shift worker population and suggest that customized health management strategies are essential for effective occupational health interventions.

Limitations

The study on metabolic health risks in shift workers presents several limitations that must be acknowledged. Firstly, the cross-sectional design restricts the ability to establish causal relationships between shift work and metabolic abnormalities. Additionally, the findings may not be generalizable to other industries, as the research focused solely on a single workplace. The reliance on self-reported questionnaire data introduces potential bias regarding work type and lifestyle choices. Furthermore, while the silhouette factor was used to determine the number of clusters, this method may not adequately capture the clinical significance of all identified clusters.

Moreover, the limited sample size raises concerns about the robustness of the reported accuracy of 87.9% from the holdout validation of the random forest model. The study’s focus exclusively on night workers precludes comparative analyses with day workers or other shift workers, highlighting the need for future research that encompasses a broader range of work types. Lastly, the absence of long-term follow-up data on outcomes such as metabolic syndrome or cardiovascular disease incidence limits the ability to evaluate whether the identified health risks within each cluster translate into actual disease development.