تعظيم عدم قابلية توقع حركة الكرة في كرة القدم: نهج قائم على إنتروبيا ريني لت优化 توزيع الأحداث العشوائية
Maximizing ball movement unpredictability in association football: A Rényi entropy-based approach to optimizing event distribution randomness

المجلة: PLoS ONE، المجلد: 21، العدد: 2
DOI: https://doi.org/10.1371/journal.pone.0326800
PMID: https://pubmed.ncbi.nlm.nih.gov/41739816
تاريخ النشر: 2026-02-25
المؤلف: Ishara Bandara وآخرون
الموضوع الرئيسي: تحليلات الرياضة والأداء

نظرة عامة

تستكشف الدراسة تطبيق إنتروبيا ريني لتحديد عشوائية توزيع الأحداث (EDRan) في كرة القدم، بهدف تحديد ما إذا كان التركيز على العشوائية في حركة الكرة داخل المناطق المهيمنة في الملعب أو توزيع أكثر توازنًا عبر جميع المناطق يتنبأ بشكل أفضل بنتائج المباريات. وجدت التحليلات أن أقوى ارتباط بين EDRan وأداء الفوز بالمباراة حدث عند $\alpha = 0$ (أقصى إنتروبيا)، مما يشير إلى أن الفرق الناجحة تستخدم مجموعة أوسع من مناطق الملعب، مما يعزز عدم القدرة على التنبؤ المكاني.

أظهرت نماذج التعلم الآلي التي تستخدم EDRan عند $\alpha = 0$ أداءً متفوقًا مقارنة بالنماذج الأساسية ونماذج تصنيف الفائزين بالمباريات الحالية. وهذا يبرز إمكانات EDRan كمقياس قوي لتقييم الأداء ويؤكد على الأهمية التكتيكية للحفاظ على حركة الكرة غير القابلة للتنبؤ في جميع أنحاء الملعب. في النهاية، تشير النتائج إلى أنه بغض النظر عن الاستراتيجيات المحددة – سواء كانت قائمة على الاستحواذ أو منخفضة الاستحواذ – تعطي الفرق الناجحة الأولوية لعدم القدرة على التنبؤ المكاني، وهو ما يجب أن يكون اعتبارًا حاسمًا في استراتيجية الفريق وتقييم الأداء.

مقدمة

تناقش مقدمة هذه الورقة البحثية تعقيدات تقييم الأداء في كرة القدم، مع التأكيد على أهمية تنسيق الفريق والتنفيذ التكتيكي على مهارات اللاعبين الفردية. نظرًا للطبيعة المنخفضة التسجيل للرياضة، تم التدقيق في المقاييس التقليدية مثل الأهداف المتوقعة (xG) واستحواذ الكرة لفعاليتها في التقاط أداء الفريق. بينما يقيم xG احتمالات التسجيل بناءً على عوامل متعلقة بالتسديد، تبرز الدراسات الحديثة أهمية تسلسل الأحداث التي تؤدي إلى التسديدات. وبالمثل، تظل العلاقة بين الاستحواذ ونتائج المباريات مثيرة للجدل، حيث تشير بعض الدراسات إلى وجود ارتباط إيجابي بينما تجد أخرى عدم وجود رابط كبير، ربما بسبب الطبيعة الديناميكية لاستراتيجيات اللعبة.

لمعالجة هذه القيود، يقترح المؤلفون مقياسًا جديدًا، وهو عشوائية توزيع الأحداث المكاني (EDRan)، الذي يقيس عشوائية حركات الكرة عبر الملعب، معتبراً أن هذا الجانب أكثر أهمية من حركات اللاعبين لتقييم الأداء الهجومي. باستخدام إنتروبيا شانون وريني، تهدف الدراسة إلى استكشاف كيف يؤثر وزن مناطق الملعب – المهيمنة مقابل النادرة – على الارتباط بأداء الفوز بالمباراة. يتم إجراء التحليل بشكل منفصل لمباريات الرجال والنساء، بهدف تحسين نماذج توقع نتائج المباريات وتقديم رؤى أعمق حول الديناميات الزمنية للعب. تسعى هذه الدراسة إلى تحسين طرق تقييم الأداء التي تتجاوز المقاييس التقليدية للتسجيل، مما يوفر فهمًا أكثر دقة لاستراتيجيات الفريق وفعاليتها.

طرق

حصلت الدراسة على موافقة أخلاقية من لجنة الموافقة الأخلاقية بجامعة كوفنتري (رقم الموافقة: P174511) والتزمت بالمعايير الأخلاقية للجامعة. باستخدام تصميم ملاحظات استعادية، قامت الدراسة بتحليل بيانات ثانوية من مباريات كرة القدم المحترفة للتحقيق في عشوائية توزيع الأحداث بين الفرق الفائزة والخاسرة. ركز التحليل على ثلاث طرق لتحديد عشوائية توزيع الأحداث المكاني (EDRan): (i) إعطاء الأولوية للمناطق المهيمنة في اللعب، (ii) وزن متساوٍ عبر جميع المناطق، و (iii) استخدام إنتروبيا شانون، التي تعدل الأوزان بناءً على احتمالات توزيع الأحداث.

لتسهيل هذا المقارنة، تم تطبيق إنتروبيا ريني مع قيم $\alpha$ تتراوح من 0 إلى 2، باستخدام مصفوفات الاستحواذ التراكمية المستندة إلى المناطق المشتقة من تقسيم ملعب كرة القدم إلى 30 منطقة متساوية وتقسيم كل مباراة إلى عشرة فترات زمنية. مكن هذا النهج من اشتقاق توزيعات الاحتمالات لتوزيع أحداث كل فريق، والتي تم ربطها بعد ذلك بنتائج المباريات لتحديد القيمة المثلى لـ $\alpha$ لـ EDRan. تم إجراء معالجة البيانات والتحليلات باستخدام Python 3.11.13 ومكتبات مختلفة ضمن بيئة Google Colab، وتم تنفيذها على جهاز كمبيوتر محمول شخصي بدون دعم GPU.

نتائج

في قسم النتائج، تحقق الدراسة من تأثير عشوائية توزيع الأحداث (EDRan) على نتائج المباريات في كرة القدم للرجال والنساء عبر عشرة فترات زمنية. تكشف التحليلات أن الفائزين يظهرون باستمرار قيم EDRan أعلى من الخاسرين، مع تضييق الفجوة مع زيادة المعامل $\alpha$. تظل الفجوة التراكمية لـ EDRan إيجابية لكلا مجموعتي البيانات، مما يشير إلى اتجاه ثابت حيث يرتبط EDRan الأعلى بالأداء الفائز، خاصة عند $\alpha = 0.5$ لبيانات الرجال و $\alpha = 2$ لبيانات النساء. ومع ذلك، يتناقص الارتباط بين اختلافات EDRan ونتائج المباريات نحو نهاية المباراة.

علاوة على ذلك، تستخدم الدراسة نماذج التعلم الآلي، وتحديدًا مصنفات الغابة العشوائية، لتقييم القوة التنبؤية لـ EDRan عبر قيم $\alpha$ المتغيرة (0، 0.1، 0.5، 1، 1.5، و2). تشير النتائج إلى أن النماذج التي تستخدم قيم $\alpha$ المنخفضة، وخاصة $\alpha = 0$، تتفوق على تلك المستندة إلى إنتروبيا شانون ($\alpha \to 1$) في توقع نتائج المباريات لبيانات الرجال، مع تحسينات كبيرة في معامل الارتباط ماثيوز (MCC). في المقابل، لا تظهر مجموعة بيانات النساء اتجاهًا ثابتًا، مع أعلى أداء عند $\alpha = 0.5. بشكل عام، تشير النتائج إلى أن مراحل اللعبة المبكرة حاسمة لتحديد نتائج المباريات، كما يتضح من تحليل أهمية الميزات لنماذج الغابة العشوائية.

مناقشة

تستكشف هذه الدراسة قياس عشوائية توزيع الأحداث (EDRan) في كرة القدم، باستخدام إنتروبيا ريني مع معلمات متغيرة ($\alpha$) لتقييم ارتباطها بنتائج المباريات. يعتمد التحليل على مجموعة بيانات من StatsBomb، تتضمن تقييمات منفصلة لمباريات الرجال (608 مباراة) والنساء (374 مباراة)، مع الاعتراف بالاختلافات الفسيولوجية والتكتيكية بين الاثنين. تشير النتائج إلى أن الفرق الفائزة تظهر عمومًا قيم EDRan أعلى، خاصة في المراحل المبكرة من المباريات، مما يشير إلى أن عدم القدرة على التنبؤ في حركة الكرة عبر الملعب يساهم بشكل إيجابي في الأداء الفائز بالمباراة. من الجدير بالذكر أن أقوى ارتباط مع نتائج المباريات يحدث عند $\alpha = 0$ (أقصى إنتروبيا)، مما يشير إلى أن العشوائية المكانية، خاصة في المناطق الأقل احتلالًا، تعزز الفعالية التكتيكية من خلال تعطيل الهياكل الدفاعية.

تم استخدام نماذج التعلم الآلي، وتحديدًا مصنفات الغابة العشوائية، للتنبؤ بنتائج المباريات بناءً على اختلافات EDRan، مما يكشف عن تحسينات كبيرة في دقة التنبؤ عندما يكون $\alpha < 1$ لبيانات الرجال. وهذا يشير إلى أن الفرق الفائزة تستخدم مجموعة أوسع من المناطق المكانية، مما يعزز عدم القدرة على التنبؤ ويعقد الاستجابات الدفاعية. على النقيض من ذلك، لم تسفر مجموعة بيانات النساء عن اتجاهات ثابتة، ربما بسبب القوة الإحصائية المحدودة، مما يشير إلى الحاجة إلى مزيد من البحث مع مجموعات بيانات أكبر. بشكل عام، تؤكد الدراسة على أهمية العشوائية المكانية في تكتيكات كرة القدم، مشددة على أن الاستخدام الفعال للملعب بأكمله يمكن أن يخلق مزايا تكتيكية، مع الإشارة أيضًا إلى الحاجة إلى الحذر في تفسير النتائج بسبب المتغيرات المربكة المحتملة.

Journal: PLoS ONE, Volume: 21, Issue: 2
DOI: https://doi.org/10.1371/journal.pone.0326800
PMID: https://pubmed.ncbi.nlm.nih.gov/41739816
Publication Date: 2026-02-25
Author(s): Ishara Bandara et al.
Primary Topic: Sports Analytics and Performance

Overview

The study explores the application of Rényi entropy to quantify event distribution randomness (EDRan) in association football, aiming to determine whether a focus on randomness in ball movement within dominant field regions or a more uniform distribution across all regions better predicts match outcomes. The analysis found that the strongest correlation between EDRan and match-winning performance occurred at $\alpha = 0$ (max entropy), indicating that successful teams utilize a broader range of field zones, thereby enhancing spatial unpredictability.

Machine learning models utilizing EDRan at $\alpha = 0$ demonstrated superior performance compared to baseline models and existing match-winner classification models. This underscores EDRan’s potential as a robust performance evaluation metric and emphasizes the tactical importance of maintaining unpredictable ball movement throughout the field. Ultimately, the findings suggest that regardless of specific strategies—whether possession-based or low-possession—successful teams prioritize spatial unpredictability, which should be a critical consideration in team strategy and performance assessment.

Introduction

The introduction of this research paper discusses the complexities of performance evaluation in association football, emphasizing the significance of team coordination and tactical execution over individual player prowess. Given the low-scoring nature of the sport, traditional metrics such as expected goals (xG) and ball possession have been scrutinized for their effectiveness in capturing team performance. While xG assesses scoring probabilities based on shot-related factors, recent studies highlight the importance of the sequence of events leading to shots. Similarly, the relationship between possession and match outcomes remains contentious, with some studies indicating a positive correlation while others find no significant link, potentially due to the dynamic nature of game strategies.

To address these limitations, the authors propose a novel metric, Spatial Event Distribution Randomness (EDRan), which quantifies the randomness of ball movements across the field, positing that this aspect is more critical than player movements for evaluating offensive performance. Utilizing Shannon and Rényi entropy, the study aims to explore how different weighting of field regions—dominant versus rare—affects the correlation with match-winning performance. The analysis is conducted separately for men’s and women’s games, with the goal of enhancing match outcome prediction models and providing deeper insights into the temporal dynamics of gameplay. This research seeks to refine performance assessment methods that transcend traditional scoring metrics, thereby offering a more nuanced understanding of team strategies and their effectiveness.

Methods

The study received ethical approval from the Coventry University Ethics Approval Committee (Approval Number: P174511) and adhered to the university’s ethical standards. Utilizing a retrospective observational design, the research analyzed secondary data from professional football matches to investigate the randomness of event distribution between winning and losing teams. The analysis focused on three methods for quantifying spatial event distribution randomness (EDRan): (i) prioritizing dominant regions of play, (ii) equal weighting across all regions, and (iii) employing Shannon entropy, which adjusts weights based on event distribution probabilities.

To facilitate this comparison, Rényi entropy was applied with $\alpha$ values ranging from 0 to 2, using region-based cumulative possession matrices derived from dividing the football field into 30 equal areas and segmenting each match into ten time intervals. This approach enabled the derivation of probability distributions for each team’s event distribution, which were then correlated with match outcomes to identify the optimal $\alpha$ value for EDRan. The data processing and analyses were conducted using Python 3.11.13 and various libraries within the Google Colab environment, executed on a personal laptop without GPU support.

Results

In the results section, the study investigates the influence of event distribution randomness (EDRan) on match outcomes in men’s and women’s football across ten time periods. The analysis reveals that winners consistently exhibit higher EDRan values than losers, with the gap narrowing as the parameter $\alpha$ increases. The cumulative EDRan difference remains positive for both datasets, indicating a consistent trend where higher EDRan correlates with winning performances, particularly at $\alpha = 0.5$ for men’s data and $\alpha = 2$ for women’s data. However, the correlation between EDRan differences and match outcomes diminishes towards the end of the game.

Further, the study employs machine learning models, specifically Random Forest classifiers, to assess the predictive power of EDRan across varying $\alpha$ values (0, 0.1, 0.5, 1, 1.5, and 2). Results indicate that models using lower $\alpha$ values, particularly $\alpha = 0$, outperform those based on Shannon entropy ($\alpha \to 1$) in predicting match outcomes for men’s data, with significant improvements in the Matthews Correlation Coefficient (MCC). In contrast, the women’s dataset does not show a consistent trend, with the highest performance at $\alpha = 0.5. Overall, the findings suggest that early game phases are critical for determining match outcomes, as indicated by the feature importance analysis of the Random Forest models.

Discussion

This study investigates the quantification of event distribution randomness (EDRan) in association football, utilizing Rényi entropy with varying parameters ($\alpha$) to assess its correlation with match outcomes. The analysis is based on a dataset from StatsBomb, comprising separate evaluations for men’s (608 matches) and women’s (374 matches) football, acknowledging the distinct physiological and tactical differences between the two. The findings indicate that winning teams generally exhibit higher EDRan values, particularly in the early phases of matches, suggesting that unpredictability in ball movement across the field contributes positively to match-winning performance. Notably, the strongest correlation with match outcomes occurs at $\alpha = 0$ (maximum entropy), indicating that spatial randomness, especially in less frequently occupied regions, enhances tactical effectiveness by disrupting defensive structures.

Machine learning models, specifically Random Forest classifiers, were employed to predict match outcomes based on EDRan differences, revealing significant improvements in predictive accuracy when $\alpha < 1$ for men's data. This suggests that winning teams utilize a broader range of spatial regions, enhancing unpredictability and complicating defensive responses. Conversely, the women's dataset did not yield consistent trends, potentially due to limited statistical power, indicating the need for further research with larger datasets. Overall, the study underscores the importance of spatial randomness in football tactics, highlighting that effective use of the entire field can create tactical advantages, while also noting the need for caution in interpreting results due to potential confounding variables.