التباين الجنسي لعظام العضد في عينة فرنسية: مقارنة بين عدة نماذج إحصائية بما في ذلك نماذج التعلم الآلي
Sexual dimorphism of the humerus bones in a French sample: comparison of several statistical models including machine learning models

المجلة: International Journal of Legal Medicine، المجلد: 139، العدد: 3
DOI: https://doi.org/10.1007/s00414-025-03417-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39856332
تاريخ النشر: 2025-01-25
المؤلف: Michel H. A. Blanc وآخرون
الموضوع الرئيسي: دراسات الأنثروبولوجيا الجنائية والبيوآركيولوجيا

نظرة عامة

تدرس هذه الدراسة فعالية تقنيات النمذجة الإحصائية المختلفة لتقدير الجنس بناءً على قياسات عظمة العضد، مع تسليط الضوء على إمكانية استخدام عظمة العضد كبديل للخصائص الحوضية التقليدية. تم تحليل عينة من 98 عظمة عضد من سكان فرنسيين معاصرين باستخدام 26 قياسًا مقياسيًا. تم استخدام سبعة نماذج إحصائية، بما في ذلك تحليل التمييز الخطي (LDA)، وتحليل التمييز المنظم (RDA)، والانحدار اللوجستي المعاقب (PLR)، وتحليل التمييز المرن (FDA)، وآلة الدعم الناقل (SVM)، والشبكة العصبية الاصطناعية (ANN)، وغابة عشوائية (RF).

تشير النتائج إلى أن جميع النماذج حققت دقة تصنيف تتجاوز 90% دون اختيار المتغيرات، مع تحسين الدقة لتتراوح بين 98% و100% عند تطبيق التبسيطات، مما يقلل عدد المتغيرات إلى ستة أو أقل. كانت النماذج الأفضل أداءً هي PLR وRF وLDA، مع تحديد قياسات معينة من الأجزاء القريبة (WTT، CSD) والبعيدة (BEW، WT، MAW، THT) من عظمة العضد، بالإضافة إلى العظمة بأكملها (PLCT)، باعتبارها ذات صلة خاصة. تؤكد هذه الدراسة على فائدة الطرق الإحصائية غير التقليدية في تعزيز دقة تقدير الجنس من قياسات عظمة العضد.

مقدمة

تستعرض مقدمة هذه الورقة البحثية أهمية الأنثروبولوجيا الجنائية، خاصة في سياق تقدير الجنس من بقايا الهيكل العظمي البشري. تؤكد أن تقدير الجنس أمر حاسم لتطوير الملفات البيولوجية، حيث يمكن أن يعزز فرص التعرف بنسبة تصل إلى 50%. تم تحديد الحوض كأكثر العظام موثوقية لتقدير الجنس، حيث تحقق دقة تزيد عن 95%، بينما يتمتع الجمجمة، التي كانت تقليديًا الخيار الثاني الأفضل، بنطاق دقة يتراوح بين 75-90%. تشير النتائج الحديثة إلى أن العظام الطويلة، وخاصة عظمة العضد، قد توفر نتائج أفضل، مع دقة تصنيف تتجاوز 80-90% في بعض الدراسات.

تناقش الورقة التباين في التباين الجنسي عبر السكان بسبب عوامل مثل حجم الجسم والوراثة، وتسلط الضوء على المزايا الهيكلية لعظمة العضد، التي تسمح بالحفاظ الأفضل بعد الوفاة. يتم مراجعة طرق أنثروبولوجية مختلفة لتقييم التباين الجنسي لعظمة العضد، بما في ذلك الأساليب النوعية والكمية والمورفولوجية الهندسية. تشير المقدمة إلى أنه على الرغم من أن العديد من الدراسات قد ركزت على قياسات عظمة العضد، إلا أن هناك نقصًا في الأبحاث التي تستخدم النماذج الإحصائية التقليدية وتقنيات التعلم الآلي لتقدير الجنس بناءً فقط على بيانات عظمة العضد. الهدف من الدراسة الحالية هو مقارنة دقة التنبؤ لسبعة تقنيات نمذجة إحصائية، بما في ذلك خوارزميات التعلم الآلي، باستخدام مجموعة أوسع من المتغيرات من عينة فرنسية لتقييم التباين الجنسي لعظمة العضد.

طرق

تستعرض قسم “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. توضح المواد المستخدمة، بما في ذلك الكواشف المحددة، والمعدات، وأي عينات بيولوجية، لضمان تكرار التجارب. تشمل المنهجية العمليات خطوة بخطوة لجمع البيانات، بما في ذلك أي تحليلات إحصائية تم إجراؤها لتفسير النتائج.

بالإضافة إلى ذلك، قد يصف القسم الظروف التجريبية، مثل درجة الحرارة، والمدة، وأي ضوابط تم تنفيذها للتحقق من صحة النتائج. من خلال تقديم نظرة شاملة على الطرق، يساعد هذا القسم في تسهيل فهم نهج البحث ويدعم مصداقية النتائج التي تم الحصول عليها.

نتائج

تشير النتائج إلى وجود اختلافات كبيرة في قياسات عظمة العضد بين الذكور والإناث، حيث يظهر الذكور متوسطات أعلى عبر معظم المتغيرات، باستثناء RI1 (p = 0.147). تم تقييم دقة النماذج الإحصائية المختلفة، مما كشف أن جميع النماذج حققت دقة تصنيف تزيد عن 90%، حيث برز تحليل التمييز المنظم (RDA) كالأكثر فعالية قبل اختيار المتغيرات. أظهر نموذج الانحدار اللوجستي المعاقب (PLR) دقة متوسطة تبلغ 0.98، بينما تراوحت دقة نماذج التعلم الآلي بين 0.96 و0.98.

تم استخدام طرق اختيار المتغيرات، بما في ذلك الاختيار التدريجي وأفضل مجموعة فرعية، لتعزيز أداء النموذج. في نموذج تحليل التمييز الخطي (LDA)، تحسنت الدقة من 0.92 إلى 0.98 مع اختيار المتغيرات. حددت طرق الاختيار الأمامي وأفضل مجموعة فرعية المتنبئين الرئيسيين، حيث أبرز نموذج FDA أربعة متغيرات حاسمة (WTT، DHGT، WT، وPLLE) التي، عند استخدامها للتنبؤات، حققت دقة 100%. حدد نموذج الغابة العشوائية (RF) خمسة متغيرات مهمة (WTT، DHGT، MAW، BEW، وCNC) تساهم في دقة تزيد عن 90%. من الجدير بالذكر أن المتغيرات WTT وBEW وWT كانت مهمة باستمرار عبر جميع النماذج تقريبًا، بينما تعرف نموذج آلة الدعم الناقل (SVM) على 15 متغيرًا بأهمية تزيد عن 90%. بشكل عام، تؤكد النتائج على فعالية اختيار المتغيرات في تعزيز دقة النموذج والدور الحاسم للمتغيرات المحددة في الأداء التنبؤي.

مناقشة

حللت الدراسة 98 عظمة عضد يسارية من أفراد فرنسيين لتقييم فعالية النماذج الإحصائية المختلفة لتقدير الجنس بناءً على قياسات عظمة العضد. تم استخدام عينة تدريبية من 60 عظمة (30 ذكور و30 إناث) لتطوير نماذج تقدير الجنس، بينما تم استخدام عينة اختبار من 38 عظمة (18 ذكور و20 إناث) لتقييم أداء النموذج. تم أخذ ما مجموعه 26 قياسًا، بما في ذلك خمسة قياسات جديدة تم تقديمها في هذه الدراسة. تم إجراء التحليلات الإحصائية باستخدام RStudio، مع استخدام طرق مثل تحليل التمييز الخطي (LDA)، والغابة العشوائية (RF)، والشبكات العصبية الاصطناعية (ANN)، من بين أمور أخرى. حقق نموذج LDA دقة تبلغ 92%، والتي تحسنت إلى 98% و99% مع طرق اختيار المتغيرات، بينما أظهر RF معدلات تصنيف عالية، مستفيدًا بشكل خاص من قدرته على التعامل مع البيانات المفقودة.

تشير النتائج إلى أن عظمة العضد يمكن أن تكون بديلاً موثوقًا لتقدير الجنس، مقارنة بالطرق التقليدية التي تستخدم الخصائص الحوضية. من الجدير بالذكر أن الدراسة حددت عرض بين التوأم (WTT) كمتغير مهم لتصنيف الجنس، حيث حقق دقة 100% في عينة الاختبار عند استخدامه في نموذج LDA. تؤكد النتائج على أهمية كل من قياسات عظمة العضد القريبة والبعيدة في التباين الجنسي وتسلط الضوء على إمكانية النماذج الإحصائية غير التقليدية، مثل خوارزميات التعلم الآلي، لتعزيز دقة تقدير الجنس. ومع ذلك، تعترف الدراسة بالقيود بسبب حجم العينة الصغيرة والتجانس الديموغرافي للعينة، مما يشير إلى أن مزيدًا من البحث مع مجموعة سكانية أكثر تنوعًا ضروري للتحقق من هذه النتائج.

Journal: International Journal of Legal Medicine, Volume: 139, Issue: 3
DOI: https://doi.org/10.1007/s00414-025-03417-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39856332
Publication Date: 2025-01-25
Author(s): Michel H. A. Blanc et al.
Primary Topic: Forensic Anthropology and Bioarchaeology Studies

Overview

The study investigates the effectiveness of various statistical modeling techniques for sex estimation based on humeral measurements, highlighting the potential of the humerus as an alternative to traditional pelvic traits. A sample of 98 humeral bones from a contemporary French population was analyzed using 26 metric measurements. Seven statistical models were employed, including Linear Discriminant Analysis (LDA), Regularized Discriminant Analysis (RDA), Penalized Logistic Regression (PLR), Flexible Discriminant Analysis (FDA), Support Vector Machine (SVM), Artificial Neural Network (ANN), and Random Forest (RF).

The findings indicate that all models achieved a classification accuracy exceeding 90% without variable selection, with accuracy improving to between 98% and 100% when simplifications were applied, reducing the number of variables to six or fewer. The best-performing models were PLR, RF, and LDA, with specific measurements from the proximal (WTT, CSD) and distal (BEW, WT, MAW, THT) parts of the humerus, as well as the entire bone (PLCT), identified as particularly relevant. This research underscores the utility of non-classical statistical methods in enhancing sex estimation accuracy from humeral measurements.

Introduction

The introduction of this research paper outlines the significance of forensic anthropology, particularly in the context of sex estimation from human skeletal remains. It emphasizes that sex estimation is crucial for developing biological profiles, as it can enhance identification chances by up to 50%. The pelvis is identified as the most reliable bone for sex estimation, achieving over 95% accuracy, while the skull, traditionally the second-best option, has an accuracy range of 75-90%. Recent findings suggest that long bones, especially the humerus, may provide even better results, with classification accuracies exceeding 80-90% in some studies.

The paper discusses the variability in sexual dimorphism across populations due to factors such as body size and genetics, and highlights the humerus’s structural advantages, which allow for better preservation post-mortem. Various anthropological methods for assessing humeral dimorphism are reviewed, including qualitative, quantitative, and morpho-geometric approaches. The introduction notes that while many studies have focused on humeral measurements, there is a lack of research employing classical statistical models and machine learning techniques for sex estimation based solely on humeral data. The objective of the current study is to compare the predictive accuracy of seven statistical modeling techniques, including machine learning algorithms, using a broader set of variables from a French sample to assess humeral sexual dimorphism.

Methods

The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the materials used, including specific reagents, equipment, and any biological samples, ensuring reproducibility of the experiments. The methodology encompasses the step-by-step processes for data collection, including any statistical analyses performed to interpret the results.

Additionally, the section may describe the experimental conditions, such as temperature, duration, and any controls implemented to validate the findings. By providing a comprehensive overview of the methods, this section serves to facilitate understanding of the research approach and supports the credibility of the results obtained.

Results

The results indicate significant differences in humerus measurements between males and females, with males exhibiting higher averages across most variables, except for RI1 (p = 0.147). The accuracy of various statistical models was assessed, revealing that all models achieved over 90% classification accuracy, with the Regularized Discriminant Analysis (RDA) emerging as the most effective prior to variable selection. The Penalized Logistic Regression (PLR) model demonstrated an average accuracy of 0.98, while machine learning models varied between 0.96 and 0.98 in accuracy.

Variable selection methods, including stepwise and best subset selection, were employed to enhance model performance. In the Linear Discriminant Analysis (LDA) model, accuracy improved from 0.92 to 0.98 with variable selection. The Forward Selection and Best Subset Selection methods identified key predictors, with the FDA model highlighting four critical variables (WTT, DHGT, WT, and PLLE) that, when used for predictions, achieved 100% accuracy. The Random Forest (RF) model identified five important variables (WTT, DHGT, MAW, BEW, and CNC) contributing to over 90% accuracy. Notably, the variables WTT, BEW, and WT were consistently important across nearly all models, while the Support Vector Machine (SVM) model recognized 15 variables with over 90% importance. Overall, the findings underscore the effectiveness of variable selection in enhancing model accuracy and the critical role of specific variables in predictive performance.

Discussion

The study analyzed 98 left humerus bones from French individuals to assess the effectiveness of various statistical models for sex estimation based on humeral measurements. A training sample of 60 bones (30 males and 30 females) was used to develop sex estimation models, while a test sample of 38 bones (18 males and 20 females) was utilized to evaluate model performance. A total of 26 measurements were taken, including five novel measurements introduced in this study. Statistical analyses were conducted using RStudio, employing methods such as Linear Discriminant Analysis (LDA), Random Forest (RF), and Artificial Neural Networks (ANN), among others. The LDA model achieved an accuracy of 92%, which improved to 98% and 99% with variable selection methods, while RF demonstrated high classification rates, particularly benefiting from its ability to handle missing data.

The findings indicate that the humerus can serve as a reliable alternative for sex estimation, comparable to traditional methods utilizing pelvic traits. Notably, the study identified the Width between the Two Tubercles (WTT) as a significant variable for sex classification, achieving 100% accuracy in the test sample when used in the LDA model. The results underscore the relevance of both proximal and distal humeral measurements in sexual dimorphism and highlight the potential of non-classical statistical models, such as machine learning algorithms, to enhance sex estimation accuracy. However, the study acknowledges limitations due to the small sample size and the demographic homogeneity of the sample, suggesting that further research with a more diverse population is necessary to validate these findings.