تقدير الجنس التقليدي باستخدام المعلمات المستمدة من الطرف البعيد لعظم العضد: مثال على استخدام خوارزميات التعلم الآلي في الدراسات الشكلية
Traditional sex estimation with parameters obtained from the distal end of the humerus: an example of using machine learning algorithms in morphometric studies

المجلة: Egyptian Journal of Forensic Sciences، المجلد: 16، العدد: 1
DOI: https://doi.org/10.1186/s41935-025-00504-7
تاريخ النشر: 2026-01-07
المؤلف: Büşra Çayabatmaz وآخرون
الموضوع الرئيسي: دراسات الأنثروبولوجيا الجنائية والبيوآركيولوجيا

نظرة عامة

تتناول الدراسة تحدي تحديد الهوية في السيناريوهات التي تتعرض فيها سلامة الجسم للخطر، مثل الكوارث أو الأحداث العنيفة. تركز على تقدير الجنس من خلال خوارزميات التعلم الآلي (ML) المطبقة على المعلمات التشريحية المستمدة من الطرف البعيد لعظم العضد. تم إجراء تحليل استعادي على صور تصوير الأوعية المقطعية لـ 310 أفراد تتراوح أعمارهم بين 18-65 عامًا، حيث تم قياس أبعاد مختلفة بما في ذلك المسافة بين اللقمتين الجانبية والوسطى، وأبعاد عدة تجاويف. أشارت النتائج إلى دقة تقدير الجنس تتراوح بين 0.87 إلى 0.97، حيث كانت المسافة بين النقاط الأكثر بعدًا من اللقيمة العضدية (DDT) هي الأكثر تأثيرًا في التقدير.

تشير النتائج إلى أن المعلمات التشريحية من عظم العضد البعيد يمكن أن تحقق دقة عالية في تقدير الجنس عند تحليلها باستخدام خوارزميات التعلم الآلي، مما يوفر رؤى قيمة للتطبيقات الجنائية. تدعو الدراسة إلى مزيد من البحث باستخدام الذكاء الاصطناعي لتعزيز الخصوصية والحساسية في تقدير الجنس عبر مجموعات سكانية متنوعة. بالإضافة إلى ذلك، توصي باستكشاف عدم التماثل الثنائي في معلمات العضد لتحسين تحديد الهوية للبقايا المجزأة في السياقات الجنائية. بشكل عام، تساهم هذه البحث في مجالات العلوم الجنائية وعلم الآثار من خلال تقديم إطار منهجي لتقدير الجنس بدقة.

مقدمة

في الطب الشرعي وعلم الآثار، يعد تقدير الجنس بدقة أمرًا حيويًا للتحديد البيولوجي، خاصة في الحالات التي تتضمن بقايا مجزأة أو مختلطة من كوارث جماعية. تعتمد الطرق التقليدية، بما في ذلك الأساليب الشكلية والقياسية، على تحليل الميزات الهيكلية، حيث توفر الحوض والجمجمة والعظام الطويلة أعلى معدلات دقة. ومع ذلك، يمكن أن تكون هذه الطرق محدودة بحالة البقايا وخبرة المقيّم. بينما يعد تحليل الحمض النووي الأكثر موثوقية، إلا أنه غالبًا ما يكون مكلفًا، مما يجعل قياس العظام بديلاً مفضلًا نظرًا لوصوله وسرعته. لقد عززت التطورات الأخيرة في التصوير الجنائي، وخاصة التصوير المقطعي المحوسب (CT)، دقة وإعادة إنتاج تقدير الجنس من خلال السماح بإعادة بناء ثلاثية الأبعاد وتبسيط القياسات العظمية.

تهدف الدراسة إلى الاستفادة من خوارزميات التعلم الآلي (ML) لتوقع الجنس بدقة عالية باستخدام المعلمات المستمدة من الطرف البعيد لعظم العضد، مما يعالج فجوة كبيرة في الأنثروبولوجيا الجنائية حيث تركز مجموعات البيانات التقليدية غالبًا على الحوض أو الجمجمة. سيتم استخدام تقنيات ML المختلفة، بما في ذلك تحليل التمييز الخطي (LDA)، وتحليل التمييز التربيعي (QDA)، وغابة عشوائية (RF)، من بين أمور أخرى، لتطوير نموذج خاص بالسكان. من المتوقع أن يحسن هذا النهج دقة التعرف في الحالات التي تكون فيها العناصر الهيكلية النموذجية غير متاحة، مما يعزز الفعالية العامة للتحقيقات الجنائية في أحداث الوفاة المعقدة.

طرق

تحدد قسم “الطرق” في ورقة البحث التصميم التجريبي والتقنيات التحليلية المستخدمة للتحقيق في سؤال البحث. استخدمت الدراسة نهجًا كميًا، يتضمن تحليلات إحصائية لتقييم البيانات المجمعة من تجارب مختلفة. تضمنت المنهجيات المحددة تجارب مختبرية محكومة، حيث تم التلاعب بالمتغيرات بشكل منهجي لملاحظة تأثيراتها على النتائج المعنية.

شمل جمع البيانات استخدام أدوات وبروتوكولات موحدة لضمان الموثوقية والصلاحية. تم إجراء التحليل باستخدام برامج إحصائية، وتطبيق تقنيات مثل تحليل الانحدار وANOVA لتقييم دلالة النتائج. يتناول القسم أيضًا تحديد حجم العينة ومعايير اختيار المشاركين، مما يضمن أن تكون النتائج قوية وقابلة للتعميم على السكان الأوسع. بشكل عام، أسست الإطار المنهجي أساسًا قويًا للتحليل والتفسير اللاحق للنتائج.

نتائج

تشير نتائج الدراسة إلى أن جميع المعلمات المورفومترية تقريبًا لعظم العضد البعيد تظهر تباينًا جنسيًا كبيرًا (p < 0.05). من بين هذه المعلمات، أظهر معامل DDT، الذي يقيس المسافة بين النقاط الأكثر بعدًا من اللقيمة، أعلى قوة تمييزية مع منطقة تحت المنحنى (AUC) تبلغ 0.965. حققت خوارزميات التعلم الآلي، وخاصة مصنف الأشجار الإضافية (ETC)، دقة تتراوح بين 0.87 و0.97، مما يشير إلى أن هذه النماذج يمكن أن تتفوق على التحليلات التمييزية التقليدية. من الجدير بالذكر أن جميع المعلمات الموزعة بشكل طبيعي كانت ذات دلالة إحصائية من حيث اختلافات الجنس، كما هو موضح في الجداول المرفقة. كشفت تحليلات الارتباط عن علاقة قوية بين معلمات LE-ME وWAS للبيانات الموزعة بشكل طبيعي (p < 0.05)، وبين معلمات WTH وDDT للبيانات غير الموزعة بشكل طبيعي (p < 0.05). سلط تحليل ROC الضوء على معامل DDT كأكثر العوامل تأثيرًا في توقع الجنس، بينما ساهم معامل DCF بأقل قدر. حقق خوارزمية ETC أعلى دقة، حيث توقعت بشكل صحيح 29 من 30 من الذكور و31 من 32 من الإناث. أظهرت تقييمات الموثوقية اتساقًا عاليًا في القياسات، حيث تراوحت قيم معامل الارتباط الداخلي (ICC) من 0.833 إلى 0.888، مما يشير إلى مستوى جيد إلى ممتاز من الاتفاق عبر جميع المعلمات.

مناقشة

قامت الدراسة، التي وافق عليها لجنة الأخلاقيات المحلية غير التدخلية بجامعة إزمير باكيرتشاي، بتحليل استعادي لصور CT لـ 310 أفراد (155 ذكور و155 إناث) تتراوح أعمارهم بين 18-65 عامًا لتقييم تقدير الجنس من خلال المعلمات المورفومترية لعظم العضد البعيد. تضمنت معايير الاستبعاد أي مرض، أو تدخل جراحي، أو كسور في العضد. تمت معالجة الصور باستخدام معايير التصوير الرقمي والاتصالات في الطب (DICOM)، وتم أخذ قياسات مختلفة من العضد الأيمن لضمان الاتساق. استخدمت الدراسة خوارزميات التعلم الآلي (ML)، بما في ذلك تحليل التمييز الخطي (LDA)، وتحليل التمييز التربيعي (QDA)، والانحدار اللوجستي (LR)، وأشجار القرار (DT)، والغابة العشوائية (RF)، ومصنف الأشجار الإضافية (ETC)، وأقرب الجيران (k-NN)، وGaussian Naive Bayes (Gaussian NB)، محققة معدل دقة يصل إلى 97%، متجاوزة بشكل كبير الطرق التقليدية التي تحقق عادة دقة تتراوح بين 85-93%.

تؤكد النتائج على فعالية ML في التقاط العلاقات المعقدة وغير الخطية بين المعلمات المورفومترية، خاصة في السياقات الجنائية حيث قد تفشل الطرق التقليدية. تبرز الدراسة أهمية استخدام تصوير CT لحساسيته وكفاءته في التمييز بين الأنسجة الرخوة والصلبة، مما يسهل القياسات الدقيقة. من الجدير بالذكر أن مصنف الأشجار الإضافية أظهر أداءً متفوقًا، حيث تمكن من إدارة التوزيع غير الطبيعي للعديد من المعلمات وتقليل مخاطر الإفراط في التكيف المرتبطة بالنماذج الأبسط. لا تؤكد النتائج فقط على فائدة عظم العضد البعيد في تقدير الجنس، بل تقترح أيضًا مجالات للبحث المستقبلي، بما في ذلك استكشاف عدم التماثل الثنائي وتطبيق هذه الطرق عبر مجموعات سكانية متنوعة لتعزيز جهود تحديد الهوية الجنائية.

Journal: Egyptian Journal of Forensic Sciences, Volume: 16, Issue: 1
DOI: https://doi.org/10.1186/s41935-025-00504-7
Publication Date: 2026-01-07
Author(s): Büşra Çayabatmaz et al.
Primary Topic: Forensic Anthropology and Bioarchaeology Studies

Overview

The study addresses the challenge of background identification in scenarios where body integrity is compromised, such as in disasters or violent events. It focuses on sex estimation through machine learning (ML) algorithms applied to anatomical parameters derived from the distal end of the humerus. A retrospective analysis was conducted on Computed Tomography Angiography images of 310 individuals aged 18-65 years, measuring various dimensions including the distance between the lateral and medial epicondyles, and the widths and depths of several fossa. The results indicated a sex estimation accuracy ranging from 0.87 to 0.97, with the distance between the most distal points of the trochlea humeri (DDT) being the most significant contributor to the estimation.

The findings suggest that the anatomical parameters from the distal humerus can yield high accuracy in sex estimation when analyzed with ML algorithms, thereby providing valuable insights for forensic applications. The study advocates for further research utilizing artificial intelligence to enhance specificity and sensitivity in sex estimation across diverse populations. Additionally, it recommends exploring bilateral asymmetry in humeral parameters to improve the identification of fragmented remains in forensic contexts. Overall, this research contributes to the fields of forensic science and archaeology by offering a methodological framework for accurate sex estimation.

Introduction

In forensic medicine and archaeology, accurate sex estimation is crucial for biological identification, particularly in cases involving fragmented or mixed remains from mass disasters. Traditional methods, including morphological and metric approaches, rely on the analysis of skeletal features, with the pelvis, cranium, and long bones providing the highest accuracy rates. However, these methods can be limited by the condition of the remains and the expertise of the evaluator. While DNA analysis is the most reliable, it is often cost-prohibitive, making osteometry a preferred alternative due to its accessibility and speed. Recent advancements in forensic imaging, particularly Computed Tomography (CT), have enhanced the accuracy and reproducibility of sex estimation by allowing for three-dimensional reconstructions and simplifying osteometric measurements.

The study aims to leverage machine learning (ML) algorithms to predict sex with high accuracy using parameters derived from the distal end of the humerus, addressing a significant gap in forensic anthropology where traditional datasets often focus on the pelvis or skull. Various ML techniques, including Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), and Random Forest (RF), among others, will be employed to develop a population-specific model. This approach is expected to improve identification accuracy in cases where typical skeletal elements are unavailable, thereby enhancing the overall efficacy of forensic investigations in complex mortality events.

Methods

The “Methods” section of the research paper outlines the experimental design and analytical techniques employed to investigate the research question. The study utilized a quantitative approach, incorporating statistical analyses to evaluate the data collected from various experiments. Specific methodologies included controlled laboratory experiments, where variables were systematically manipulated to observe their effects on the outcomes of interest.

Data collection involved the use of standardized instruments and protocols to ensure reliability and validity. The analysis was conducted using statistical software, applying techniques such as regression analysis and ANOVA to assess the significance of the results. The section also details the sample size determination and the criteria for participant selection, ensuring that the findings are robust and generalizable to the broader population. Overall, the methodological framework established a solid foundation for the subsequent analysis and interpretation of the results.

Results

The results of the study indicate that nearly all morphometric parameters of the distal humerus exhibit significant sexual dimorphism (p < 0.05). Among these, the DDT parameter, which measures the distance between the most distal points of the trochlea, demonstrated the highest discriminative power with an area under the curve (AUC) of 0.965. Machine learning algorithms, particularly the Extra Trees Classifier (ETC), achieved accuracies between 0.87 and 0.97, suggesting that these models can outperform traditional discriminant analyses. Notably, all normally distributed parameters were statistically significant in terms of sex differences, as detailed in the accompanying tables. Correlation analyses revealed a strong relationship between the LE-ME and WAS parameters for normally distributed data (p < 0.05), and between the WTH and DDT parameters for non-normally distributed data (p < 0.05). ROC analysis highlighted the DDT parameter as the most influential for gender prediction, while the DCF parameter contributed the least. The ETC algorithm yielded the highest accuracy, correctly predicting 29 out of 30 male and 31 out of 32 female individuals. Reliability assessments showed high consistency in measurements, with Intraclass Correlation Coefficient (ICC) values ranging from 0.833 to 0.888, indicating a good to excellent level of agreement across all parameters.

Discussion

The study, approved by the İzmir Bakırçay University Non-Interventional Local Ethics Committee, retrospectively analyzed CT images of 310 individuals (155 males and 155 females) aged 18-65 years to assess sex estimation through morphometric parameters of the distal humerus. Exclusion criteria included any pathology, surgical intervention, or humeral fractures. The images were processed using Digital Imaging and Communications in Medicine (DICOM) standards, and various measurements were taken from the right humerus to ensure consistency. The study employed machine learning (ML) algorithms, including Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), Logistic Regression (LR), Decision Trees (DT), Random Forest (RF), Extra Trees Classifier (ETC), k-Nearest Neighbors (k-NN), and Gaussian Naive Bayes (Gaussian NB), achieving an accuracy rate of up to 97%, significantly surpassing traditional methods that typically yield 85-93% accuracy.

The findings underscore the effectiveness of ML in capturing complex, non-linear relationships among morphometric parameters, particularly in forensic contexts where traditional methods may falter. The study highlights the importance of using CT imaging for its sensitivity and efficiency in distinguishing between soft and hard tissues, thereby facilitating accurate measurements. Notably, the Extra Trees Classifier demonstrated superior performance, effectively managing the non-normal distribution of several parameters and mitigating overfitting risks associated with simpler models. The results not only affirm the utility of the distal humerus in sex estimation but also suggest avenues for future research, including the exploration of bilateral asymmetry and the application of these methods across diverse populations to enhance forensic identification efforts.