تقييم موثوقية التقنيات الخالية من العلامات في تحليل الحركة البيوميكانيكية: مقارنة الأداء
Reliability assessment of markerless technologies in biomechanical motion analysis: a performance comparison

المجلة: Frontiers in Sports and Active Living، المجلد: 7
DOI: https://doi.org/10.3389/fspor.2025.1712332
PMID: https://pubmed.ncbi.nlm.nih.gov/41602810
تاريخ النشر: 2026-01-12
المؤلف: Zhenyun Du
الموضوع الرئيسي: التوازن، والمشي، والوقاية من السقوط

نظرة عامة

تقيّم ورقة البحث موثوقية أنظمة التقاط الحركة بدون علامات مقارنةً بنظام يعتمد على العلامات (OptiTrack)، الذي يُعتبر المعيار الذهبي. تشمل الأنظمة التي تم تقييمها StereoLabs ZED 2i وMediaPipe (2D و3D) وYOLOv8 Pose (8n و8x-p6). باستخدام معاملات الارتباط بين الفئات (ICC) وتحليل بلاند-ألتمن، تحلل الدراسة حركات الأطراف العليا والسفلى البسيطة في بيئة خاضعة للرقابة. تكشف النتائج أن نظام StereoLabs ZED 2i يظهر أعلى موثوقية بين الأنظمة التي لا تستخدم علامات، مع قيم ICC تبلغ 0.92 للإعدادات متعددة الكاميرات و0.88 للكاميرات الاستريو الفردية، بينما يظهر MediaPipe 2D موثوقية تنافسية (ICC: 0.85).

تؤكد الدراسة على تداعيات هذه النتائج لاختيار تقنيات التقاط الحركة عبر تطبيقات مختلفة، مشددة على جدوى نظام StereoLabs عندما يكون تركيب العلامات غير عملي. على الرغم من أن الأنظمة المعتمدة على العلامات تظل المعيار الذهبي للتحليل التفصيلي، فإن التقدم في رؤية الكمبيوتر وتعلم الآلة قد عزز من قابلية تطبيق الأنظمة التي لا تستخدم علامات، خاصة في السياقات التي تكون فيها التكلفة وسهولة الاستخدام وعدم التدخل أمورًا حاسمة. يدعو المؤلفون إلى أن تركز الأبحاث المستقبلية على دمج تقنيات دمج الرؤى المتعددة، والقيود البيوميكانيكية، ومجموعات بيانات التدريب الأكبر لتحسين متانة ودقة الأنظمة التي لا تستخدم علامات، مما يسهم في سد الفجوة بين القدرات الحالية ومتطلبات التطبيقات السريرية والرياضية.

مقدمة

تناقش مقدمة ورقة البحث هذه التأثير التحويلي للتقدم في تكنولوجيا التقاط الحركة عبر مجالات مختلفة، بما في ذلك البيوميكانيكا وعلوم الرياضة وإعادة التأهيل. تبرز النوعين الرئيسيين من أنظمة التقاط الحركة: المعتمدة على العلامات وغير المعتمدة عليها. تُلاحظ الأنظمة المعتمدة على العلامات لدقتها العالية في التقاط الحركات المعقدة، باستخدام كاميرات الأشعة تحت الحمراء وعلامات عاكسة سلبية. ومع ذلك، تأتي مع قيود مثل الإعداد الذي يستغرق وقتًا طويلاً، والتكاليف العالية، والقيود على البيئات الخاضعة للرقابة. في المقابل، تقدم الأنظمة غير المعتمدة على العلامات، التي تستفيد من رؤية الكمبيوتر والتعلم العميق، بديلاً أكثر مرونة وفعالية من حيث التكلفة من خلال تقدير وضع الإنسان مباشرة من الفيديو دون علامات مادية. لقد أظهرت هذه الأنظمة، بما في ذلك تلك التي تستخدم كاميرات العمق مثل StereoLabs، وعدًا في تطبيقات مثل إعادة التأهيل عن بُعد، على الرغم من أنها لا تزال تواجه تحديات تتعلق بالاعتراضات وحساسية البيئة.

تؤكد الورقة على الحاجة إلى تقييمات منهجية للأنظمة غير المعتمدة على العلامات، خاصةً بالمقارنة مع الأنظمة المعتمدة على العلامات، حيث تركز الدراسات الحالية غالبًا على تكوينات غير معتمدة على العلامات الفردية ومهام محددة. يهدف المؤلفون إلى سد هذه الفجوة من خلال مقارنة منهجية لنظام مرجعي يعتمد على العلامات (OptiTrack) مع إعدادات غير معتمدة على العلامات، بما في ذلك StereoLabs وأنظمة الكاميرا الفردية المعتمدة على MediaPipe وYOLOv8 Pose. من خلال تصميم تجريبي خاضع للرقابة، يتضمن موضوعًا واحدًا، يسعى البحث إلى تقييم موثوقية ودقة قياسات زوايا المفاصل من هذه الأنظمة غير المعتمدة على العلامات مقارنةً بالمعيار الذهبي. تركز السؤال البحثي المركزي على مدى قدرة تقنيات التقاط الحركة غير المعتمدة على العلامات المستخدمة بشكل شائع على توفير بيانات موثوقة لزوايا المفاصل، مما يساعد الأطباء والعلماء الرياضيين في اختيار التقنيات المناسبة بناءً على الدقة والتكلفة والجدوى.

الطرق

استخدمت الدراسة تصميمًا تجريبيًا مكثفًا يعتمد على قياسات متكررة، مع موضوع واحد (SSED) للتحقيق في أداء تقنيات التقاط الحركة المختلفة على مفاصل الكتف والمرفق والورك والركبة. تم جمع البيانات من مشاركة أنثوية صحية (20 عامًا، 165 سم، 53 كجم) دون أي إعاقات عضلية هيكلية أو عصبية. كان اختيار تصميم موضوع واحد يهدف إلى تقليل التباين بين المشاركين، والذي يمكن أن يؤثر على النتائج في دراسات التحقق البيوميكانيكية. من خلال ضمان تنفيذ تشريحي وحركي متسق عبر التجارب، عززت الدراسة الصلاحية الداخلية وعزلت تباين القياس الناتج عن تقنيات التقاط الحركة التي تم اختبارها.

شملت الحركات التي تم تحليلها التباعد/التقارب، والتباعد الأفقي/التقارب، والدوران عند الكتف؛ والانثناء/التمديد عند المرفق؛ وحركات مشابهة عند الورك والركبة. تم إجراء التقاط الحركة باستخدام نظام OptiTrack، الذي يُعتبر المعيار الذهبي، إلى جانب كاميرات StereoLabs. تم تقييم أداء نموذج تتبع الجسم من StereoLabs أولاً مقابل نظام OptiTrack. بعد ذلك، قامت الدراسة بتقييم أداء MediaPipe ونسختين من بنية YOLOv8 Pose: نموذج YOLOv8n-pose، الذي يفضل السرعة على الدقة، ونموذج YOLOv8x-pose-p6، الذي، على الرغم من كونه أبطأ، يوفر دقة أعلى للتحليلات التفصيلية. يضع هذا النهج المنهجي أساسًا لتقييم الأنظمة غير المعتمدة على العلامات في سيناريوهات الحركة الأكثر تعقيدًا.

المناقشة

في هذه الدراسة، تمت مقارنة أداء أنظمة التقاط الحركة المعتمدة على العلامات وغير المعتمدة عليها بشكل شامل، مع التركيز على حركات الأطراف العليا والسفلى. تم تأسيس نظام OptiTrack كمعيار ذهبي للتتبع المعتمد على العلامات، بينما تم تقييم أنظمة غير معتمدة على العلامات، بما في ذلك إعدادات متعددة الكاميرات وكاميرات فردية من StereoLabs وMediaPipe وYOLOv8. أشارت النتائج إلى أن نظام StereoLabs متعدد الكاميرات أظهر أعلى موثوقية نسبية، مع متوسط معامل ارتباط داخلي (ICC) يبلغ 0.915، بينما أظهرت الطرق ذات الكاميرا الفردية عمومًا موثوقية أقل وانحيازات أكبر. من الجدير بالذكر أن الدراسة أبرزت أنه بينما حققت بعض الأنظمة غير المعتمدة على العلامات موثوقية متوسطة إلى عالية، كانت توافقها المطلق مع المعيار الذهبي محدودًا، خاصةً للحركات المعقدة التي تتضمن الدورانات والاعتراضات.

تؤكد النتائج على أهمية اختيار تقنية التقاط الحركة المناسبة بناءً على المتطلبات المحددة للدراسة. على الرغم من أن الأنظمة المعتمدة على العلامات تظل المعيار الذهبي للقياسات الدقيقة، فإن التقدم في الأنظمة غير المعتمدة على العلامات يجعلها بدائل قابلة للتطبيق، خاصةً في السيناريوهات التي تكون فيها العلامات غير عملية. تدعو الدراسة إلى أن تركز التطورات المستقبلية على تحسين تقنيات دمج الرؤى المتعددة، وتعزيز القيود البيوميكانيكية، وتوسيع مجموعات بيانات التدريب لتعزيز متانة وقابلية تطبيق الأنظمة غير المعتمدة على العلامات في السياقات السريرية والرياضية. بشكل عام، بينما تظهر الأنظمة غير المعتمدة على العلامات وعدًا، فإن قيودها الحالية تتطلب اعتبارًا دقيقًا في التطبيقات التي تتطلب دقة عالية.

القيود

تحدد هذه القسم قيود الدراسة، التي أجرت تحليلًا مقارنًا لتقنيات غير المعتمدة على العلامات باستخدام تصميم تجريبي يعتمد على موضوع واحد (SSED). بينما كانت هذه الطريقة فعالة في تقليل التباين بين المشاركين وزيادة الصلاحية الداخلية، فإنها تحد من إمكانية تعميم النتائج عبر مجموعات سكانية متنوعة، بما في ذلك الاختلافات في الجنس ونوع الجسم والعمر. كان تركيز الدراسة على الحركات الخاضعة للرقابة ذات درجة حرية واحدة (DoF) عند سرعات منخفضة يهدف إلى عزل تباين القياس وتأسيس خط أساس للدقة التقنية، ولكن يجب أن يُنظر إليه كدليل على المفهوم بدلاً من تقييم شامل للصلاحية البيئية.

بالإضافة إلى ذلك، قد لا تمثل تكوين الملابس للمشاركة، التي ارتدت بدلة سوداء موحدة مع علامات عاكسة، الظروف المثلى لأنظمة التتبع غير المعتمدة على العلامات، مما قد يؤثر على دقتها. يؤكد المؤلفون على أن الأبحاث المستقبلية يجب أن تتوسع في هذه النتائج من خلال تضمين مجموعة أكبر وأكثر تنوعًا من المشاركين، بالإضافة إلى استكشاف أداء هذه التقنيات أثناء الحركات الديناميكية، عالية السرعة، والصحيحة بيئيًا، مع التركيز على ترددات اكتساب أعلى لتعزيز الموثوقية في السيناريوهات الأكثر تعقيدًا.

Journal: Frontiers in Sports and Active Living, Volume: 7
DOI: https://doi.org/10.3389/fspor.2025.1712332
PMID: https://pubmed.ncbi.nlm.nih.gov/41602810
Publication Date: 2026-01-12
Author(s): Zhenyun Du
Primary Topic: Balance, Gait, and Falls Prevention

Overview

The research paper evaluates the reliability of various markerless motion capture systems in comparison to a marker-based system (OptiTrack), which serves as the gold standard. The systems assessed include StereoLabs ZED 2i, MediaPipe (2D and 3D), and YOLOv8 Pose (8n and 8x-p6). Using intraclass correlation coefficients (ICC) and Bland-Altman analysis, the study analyzes simple upper and lower limb movements in a controlled setting. The findings reveal that the StereoLabs ZED 2i demonstrates the highest reliability among the markerless systems, with ICC values of 0.92 for multi-camera setups and 0.88 for single stereo cameras, while MediaPipe 2D shows competitive reliability (ICC: 0.85).

The study emphasizes the implications of these findings for the selection of motion capture technologies across various applications, highlighting the practicality of the StereoLabs system when marker installation is impractical. Although marker-based systems remain the gold standard for detailed analysis, advancements in computer vision and machine learning have enhanced the applicability of markerless systems, particularly in contexts where cost, ease of use, and non-invasiveness are critical. The authors advocate for future research to focus on integrating multi-view fusion techniques, biomechanical constraints, and larger training datasets to improve the robustness and accuracy of markerless systems, ultimately bridging the gap between current capabilities and the demands of clinical and athletic applications.

Introduction

The introduction of this research paper discusses the transformative impact of advancements in motion capture technology across various fields, including biomechanics, sports science, and rehabilitation. It highlights the two primary types of motion capture systems: marker-based and markerless. Marker-based systems are noted for their high accuracy and precision in capturing complex movements, utilizing infrared cameras and passive reflective markers. However, they come with limitations such as time-consuming setup, high costs, and restrictions to controlled environments. In contrast, markerless systems, which leverage computer vision and deep learning, offer a more flexible and cost-effective alternative by estimating human pose directly from video without physical markers. These systems, including those using depth cameras like the StereoLabs, have shown promise in applications such as tele-rehabilitation, although they still face challenges related to occlusions and environmental sensitivity.

The paper emphasizes the need for systematic evaluations of markerless systems, particularly in comparison to marker-based systems, as existing studies often focus on single markerless configurations and specific tasks. The authors aim to fill this gap by systematically comparing a marker-based reference system (OptiTrack) with various markerless setups, including StereoLabs and single-camera pipelines based on MediaPipe and YOLOv8 Pose. Through a controlled, single-subject, repeated-measures design, the study seeks to assess the reliability and accuracy of joint angle measurements from these markerless systems against the gold standard. The central research question focuses on the extent to which commonly used markerless motion capture technologies can provide reliable joint angle data, thereby aiding clinicians and sports scientists in selecting appropriate technologies based on accuracy, cost, and feasibility.

Methods

The study utilized an intensive repeated-measures, single-subject experimental design (SSED) to investigate the performance of various motion capture technologies on shoulder, elbow, hip, and knee joints. Data were collected from a healthy female participant (20 years old, 165 cm tall, 53 kg) without musculoskeletal or neurological impairments. The choice of a single-subject design aimed to minimize inter-participant variability, which can confound results in biomechanical validation studies. By ensuring consistent anatomical and movement execution across trials, the study maximized internal validity and isolated measurement variance attributable to the motion capture technologies being tested.

The movements analyzed included abduction/adduction, horizontal abduction/adduction, and rotation at the shoulder; flexion/extension at the elbow; and similar movements at the hip and knee. Motion capture was conducted using the OptiTrack system, regarded as the gold standard, alongside StereoLabs cameras. The performance of the StereoLabs body tracking model was first evaluated against the OptiTrack system. Subsequently, the study assessed the performance of MediaPipe and two variants of the YOLOv8 Pose architecture: the YOLOv8n-pose model, which prioritizes speed over accuracy, and the YOLOv8x-pose-p6 model, which, while slower, provides higher accuracy for detailed analyses. This methodological approach establishes a foundation for evaluating markerless systems in more complex movement scenarios.

Discussion

In this study, the performance of marker-based and markerless motion capture systems was comprehensively compared, focusing on both upper and lower extremity movements. The OptiTrack system was established as the gold standard for marker-based tracking, while various markerless systems, including multi-camera and single-camera setups from StereoLabs, MediaPipe, and YOLOv8, were evaluated. The results indicated that the multi-camera StereoLabs system exhibited the highest relative reliability, with an average Intraclass Correlation Coefficient (ICC) of 0.915, while single-camera methods generally showed lower reliability and larger biases. Notably, the study highlighted that while some markerless systems achieved moderate-to-high reliability, their absolute agreement with the gold standard was limited, particularly for complex movements involving rotations and occlusions.

The findings underscore the importance of selecting the appropriate motion capture technology based on the specific requirements of the study. Although marker-based systems remain the gold standard for precise measurements, advancements in markerless systems make them viable alternatives, especially in scenarios where markers are impractical. The study advocates for future developments to focus on improving multi-view fusion techniques, enhancing biomechanical constraints, and expanding training datasets to bolster the robustness and applicability of markerless systems in clinical and athletic contexts. Overall, while markerless systems show promise, their current limitations necessitate careful consideration in applications demanding high precision.

Limitations

This section outlines the limitations of the study, which conducted a comparative analysis of markerless technologies using a single-subject experimental design (SSED). While this approach effectively minimized inter-subject variability and maximized internal validity, it restricts the generalizability of findings across diverse populations, including variations in gender, body type, and age. The study’s focus on controlled, single-degree-of-freedom (DoF) movements at low velocities aimed to isolate measurement variance and establish a baseline for technical precision, but it should be viewed as a proof-of-concept rather than a comprehensive assessment of ecological validity.

Additionally, the clothing configuration of the participant, who wore a standardized black bodysuit with reflective markers, may not represent optimal conditions for markerless tracking systems, potentially affecting their accuracy. The authors emphasize that future research should expand upon these findings by including a larger and more diverse participant cohort, as well as exploring the performance of these technologies during dynamic, high-speed, and ecologically valid movements, with an emphasis on higher acquisition frequencies to enhance reliability in more complex scenarios.