مجموعة بيانات التصوير الطيفي الفائق لتقييم الخصوبة والبنية غير التدميرية لبيض الدجاج
Hyperspectral imaging dataset for non-destructive fertility and structural evaluation of chicken eggs

المجلة: Scientific Data، المجلد: 13، العدد: 1
DOI: https://doi.org/10.1038/s41597-026-06556-1
PMID: https://pubmed.ncbi.nlm.nih.gov/41565718
تاريخ النشر: 2026-01-22
المؤلف: Md Wadud Ahmed وآخرون
الموضوع الرئيسي: تغذية الحيوان وعلم وظائف الأعضاء

نظرة عامة

تقدم هذه القسم نظرة عامة على دراسة تركزت على التصوير الطيفي العالي (HSI) كطريقة غير مدمرة لتقييم خصوبة البيض والخصائص الهيكلية. على الرغم من الاهتمام المتزايد في أبحاث الدواجن، فإن غياب مجموعات بيانات HSI المتاحة للجمهور قد أعاق تطوير نماذج تعلم الآلة الفعالة. لسد هذه الفجوة، تقدم الدراسة مجموعة بيانات HSI شاملة تتضمن معلمات حاسمة مثل حالة الخصوبة قبل الحضانة، سمك قشرة البيض، كتلة الصفار، قوة قشرة البيض، وقياسات شكلية متنوعة (كتلة البيض السليمة، الأقطار الكبرى والصغرى).

تتكون مجموعة البيانات من صور طيفية عالية لـ 1,228 بيضة دجاج من سلالة ليغورن البيضاء تم التقاطها باستخدام نظام HSI لنقل المسح الخطي يعمل في نطاق الطول الموجي من 374-1015 نانومتر. يتم إقران بيانات HSI لكل بيضة مع قياسات مرجعية موثوقة، مما يسهل تطبيقات التعلم الموجه مثل الانحدار والتصنيف. تتوفر مجموعة البيانات بتنسيق مكعب طيفي خام (.mat) وبيانات وصف طيفية مشروحة (.csv)، مما يضمن سهولة الوصول والاستخدام. وقد أكدت التحقق الفني موثوقية مجموعة البيانات، مما يجعلها موردًا قيمًا مفتوح الوصول للبحوث المستقبلية في علم الدواجن.

مقدمة

تسلط مقدمة هذه الورقة البحثية الضوء على أهمية البيض كمصدر حيوي للبروتين الكامل والمواد الغذائية الأساسية في النظام الغذائي البشري. وتؤكد على الحاجة إلى طرق تقييم سريعة وغير مدمرة للمعلمات الرئيسية للبيض، مثل الخصوبة قبل الحضانة، وخصائص القشرة، ومحتوى الصفار، والتي تعتبر حاسمة لصناعات الدواجن والغذاء. مع حوالي 130 مليون بيضة دجاج يتم حضانتها سنويًا ومعدلات العقم تتراوح بين 5-20%، يمكن أن يعزز التنبؤ الفعال بخصوبة البيض قبل الحضانة عمليات الحضانة ويساهم في تحقيق الهدف الثاني من أهداف التنمية المستدامة من خلال تعزيز إنتاج الغذاء المستدام.

غالبًا ما تكون الطرق التقليدية لتقييم جودة البيض، بما في ذلك الإضاءة واختبار الآلات، مدمرة ومرهقة، مما يؤدي إلى عدم الكفاءة والخسائر الاقتصادية المحتملة. في المقابل، ظهر التصوير الطيفي العالي (HSI) كبديل غير مدمّر، مما يسمح بتحليل عالي الإنتاجية لجودة البيض الداخلية وخصائصه الهيكلية. تقدم هذه الدراسة مجموعة بيانات من 1,228 بيضة دجاج من سلالة ليغورن البيضاء تم تحليلها باستخدام نظام HSI لنقل المسح الخطي، تغطي نطاق طيفي من 374-1015 نانومتر. تتضمن مجموعة البيانات حالات خصوبة متنوعة ومعلمات شكلية، مما يوفر أساسًا لتطوير نماذج تنبؤية. تستخدم الدراسة تحليل الانحدار الجزئي (PLSR) وتحليل التمييز الجزئي (PLS-DA) للتنبؤ بكتلة الصفار وتصنيف خصوبة البيض، مع ضمان التحقق القوي من خلال تقسيم البيانات المنظم. تهدف الأعمال المستقبلية إلى توسيع هذه المنهجية لتشمل البيض ذو القشرة البنية وسلالات الدواجن الأخرى.

طرق

تحدد قسم “الطرق” تصميم التجربة والتقنيات التحليلية المستخدمة في الدراسة. استخدم الباحثون نهجًا كميًا، حيث نفذوا تجارب محكومة لجمع البيانات حول المتغيرات المحددة. تم إجراء تحليلات إحصائية باستخدام أدوات البرمجيات لضمان تفسير قوي للنتائج، بما في ذلك تحليل الانحدار لتحديد العلاقات بين المتغيرات المستقلة والتابعة.

بالإضافة إلى ذلك، شملت المنهجية وصفًا تفصيليًا لعملية اختيار العينة، مما يضمن أن المشاركين كانوا ممثلين للسكان المستهدفين. تم توحيد طرق جمع البيانات لتقليل التحيز، وتم الالتزام بالاعتبارات الأخلاقية طوال الدراسة. تختتم هذه القسم بمناقشة قيود الطرق المستخدمة، مع تسليط الضوء على مجالات البحث المستقبلية والتحسينات المحتملة في تصميم التجارب.

مناقشة

تضمنت الأبحاث التي أجريت في جامعة إلينوي أوربانا-شامبين جمع وتحليل 1,228 بيضة دجاج من سلالة ليغورن البيضاء، مصنفة إلى 612 عينة خصبة و616 عينة غير خصبة. تم جمع البيض على مدى ثلاثة أشهر، مما يضمن تمثيلًا متنوعًا للعناصر. تم قياس المعلمات الفيزيائية الرئيسية مثل الكتلة، والأقطار الكبرى والصغرى، وسمك القشرة، وكتلة الصفار، مما يكشف عن تباين كبير يعزز قابلية تطبيق مجموعة البيانات في النمذجة التنبؤية لتقييم جودة البيض. استخدمت الدراسة التصوير الطيفي العالي (HSI) لالتقاط البيانات الطيفية عبر نطاق من 374-1015 نانومتر، مع التحكم الدقيق في ظروف التصوير لضمان سلامة العينات ودقة البيانات المجمعة.

شمل التحليل التحقق الفني الصارم من بيانات HSI والقياسات المرجعية، باستخدام نماذج تعلم الآلة لضمان اتساق البيانات وقوتها. أظهر نموذج الانحدار الجزئي (PLSR) قدرة تنبؤية قوية لكتلة الصفار، محققًا قيم R² تبلغ 0.74 في المعايرة و0.69 في الاختبار. بالإضافة إلى ذلك، حقق نموذج تحليل التمييز الجزئي (PLS-DA) لتصنيف الخصوبة معدلات دقة عالية، حيث بلغت 94.2% في المعايرة و90.3% في الاختبار. تؤكد هذه النتائج على إمكانيات مجموعة البيانات لتطوير نماذج تنبؤية متطورة في تقييم جودة البيض، مع آثار على كل من الممارسات الزراعية وتطبيقات البحث. مجموعة البيانات متاحة للجمهور، مما يسهل المزيد من البحث وتطوير النماذج في هذا المجال.

Journal: Scientific Data, Volume: 13, Issue: 1
DOI: https://doi.org/10.1038/s41597-026-06556-1
PMID: https://pubmed.ncbi.nlm.nih.gov/41565718
Publication Date: 2026-01-22
Author(s): Md Wadud Ahmed et al.
Primary Topic: Animal Nutrition and Physiology

Overview

The section provides an overview of a study focused on hyperspectral imaging (HSI) as a non-destructive method for assessing egg fertility and structural characteristics. Despite the growing interest in poultry research, the absence of publicly available HSI datasets has hindered the development of effective machine learning models. To fill this gap, the study introduces a comprehensive HSI dataset that includes critical parameters such as preincubation fertility status, eggshell thickness, yolk mass, eggshell strength, and various morphological measurements (intact egg mass, major and minor diameters).

The dataset comprises hyperspectral images of 1,228 white Leghorn chicken eggs captured using a line-scan transmission HSI system operating in the wavelength range of 374-1015 nm. Each egg’s hyperspectral data is paired with validated reference measurements, facilitating supervised learning applications like regression and classification. The dataset is made available in raw hyperspectral cube format (.mat) and annotated spectral metadata (.csv), ensuring ease of access and usability. Technical validation has confirmed the dataset’s reliability, making it a valuable open-access resource for future research in poultry science.

Introduction

The introduction of this research paper highlights the significance of eggs as a vital source of complete protein and essential nutrients in the human diet. It emphasizes the need for rapid and non-destructive assessment methods for key egg parameters, such as pre-incubation fertility, shell characteristics, and yolk content, which are crucial for the poultry and food industries. With approximately 130 million chicken eggs incubated annually and infertility rates ranging from 5-20%, effective pre-incubation fertility prediction could enhance hatchery operations and contribute to Sustainable Development Goal 2 by promoting sustainable food production.

Traditional methods for assessing egg quality, including candling and mechanical testing, are often destructive and labor-intensive, leading to inefficiencies and potential economic losses. In contrast, hyperspectral imaging (HSI) has emerged as a non-destructive alternative, allowing for high-throughput analysis of eggs’ internal quality and structural properties. This study presents a dataset of 1,228 white leghorn chicken eggs analyzed using a line-scan transmission HSI system, covering a spectral range of 374-1015 nm. The dataset includes various fertility statuses and morphological parameters, providing a foundation for developing predictive models. The research employs partial least squares regression (PLSR) and partial least squares-discriminant analysis (PLS-DA) to predict yolk mass and classify egg fertility, ensuring robust validation through a structured data division. Future work aims to extend this methodology to include brown-shelled eggs and other poultry breeds.

Methods

The “Methods” section outlines the experimental design and analytical techniques employed in the study. The researchers utilized a quantitative approach, implementing controlled experiments to gather data on the specified variables. Statistical analyses were conducted using software tools to ensure robust interpretation of the results, including regression analysis to identify relationships between the independent and dependent variables.

Additionally, the methodology included a detailed description of the sample selection process, ensuring that the participants were representative of the target population. Data collection methods were standardized to minimize bias, and ethical considerations were adhered to throughout the study. The section concludes with a discussion of the limitations of the methods used, highlighting areas for future research and potential improvements in experimental design.

Discussion

The research conducted at the University of Illinois Urbana-Champaign involved the collection and analysis of 1,228 white Leghorn chicken eggs, categorized into 612 fertile and 616 infertile samples. The eggs were collected over three months, ensuring a diverse representation of samples. Key physical parameters such as mass, major and minor diameters, shell thickness, and yolk mass were measured, revealing significant variability that enhances the dataset’s applicability for predictive modeling in egg quality assessment. The study employed hyperspectral imaging (HSI) to capture spectral data across a range of 374-1015 nm, with careful control of imaging conditions to ensure the integrity of the samples and the accuracy of the data collected.

The analysis included rigorous technical validation of the HSI data and reference measurements, utilizing machine learning models for data consistency and robustness. The Partial Least Squares Regression (PLSR) model demonstrated a strong predictive capability for yolk mass, achieving R² values of 0.74 in calibration and 0.69 in testing. Additionally, the PLS-Discriminant Analysis (PLS-DA) model for fertility classification yielded high accuracy rates, with 94.2% in calibration and 90.3% in testing. These findings underscore the dataset’s potential for developing sophisticated predictive models in egg quality assessment, with implications for both agricultural practices and research applications. The dataset is publicly available, facilitating further research and model development in this domain.