نفس البيانات، محللون مختلفون: التباين في أحجام التأثير بسبب القرارات التحليلية في علم البيئة وعلم الأحياء التطوري
Same data, different analysts: variation in effect sizes due to analytical decisions in ecology and evolutionary biology

المجلة: BMC Biology، المجلد: 23، العدد: 1
DOI: https://doi.org/10.1186/s12915-024-02101-x
PMID: https://pubmed.ncbi.nlm.nih.gov/39915771
تاريخ النشر: 2025-02-06
المؤلف: Elliot Gould وآخرون
الموضوع الرئيسي: توزيع الأنواع وتغير المناخ

نظرة عامة

تبحث الدراسة في التباين الكبير في أحجام التأثير وتنبؤات النماذج الناتجة عن قرارات تحليلية مختلفة اتخذها الباحثون في علم البيئة وعلم الأحياء التطوري. باستخدام مجموعتين من البيانات غير المنشورة – واحدة تركز على الطائر الأزرق (Cyanistes caeruleus) والأخرى على الأوكاليبتوس – شملت الدراسة 174 فريقًا من المحللين وكشفت عن تباين كبير في النتائج. بالنسبة لمجموعة بيانات الطائر الأزرق، أشار المتوسط إلى علاقة سلبية بين عدد الأشقاء ونمو الفراخ، مع نطاق واسع من أحجام التأثير، بينما أظهرت مجموعة بيانات الأوكاليبتوس علاقة سلبية ضعيفة بين تغطية العشب وتجنيد الشتلات، مع بعض التأثيرات الشاذة.

تسلط النتائج الضوء على أن التباينات في الأساليب التحليلية، واختيار المتغيرات، وتقييمات مراجعة الأقران لم تتوافق مع الانحرافات عن المتوسط التحليلي، مما يشير إلى أنه لا يمكن اعتبار أي تحليل واحد إجابة نهائية على أسئلة البحث. يدعو المؤلفون إلى زيادة الشك بشأن التحليلات الفردية والتحليلات الميتا، مؤكدين على الحاجة إلى الوعي بتأثير المرونة التحليلية على نتائج البحث. يدعون إلى مناقشات داخل المجتمع العلمي حول معالجة التباين في النتائج الناجم عن الخيارات التحليلية.

مقدمة

تؤكد مقدمة هذه الورقة البحثية على أهمية القابلية للتكرار في الدراسات العلمية، لا سيما في علم البيئة وعلم الأحياء التطوري. بينما تعتبر القابلية للتكرار هدفًا أساسيًا، يعترف المؤلفون بأن القابلية للتكرار المثالية غير واقعية بسبب التباين الفطري في أحجام التأثير وتأثير “المعتدلات الخفية” التي قد تؤثر على النتائج. يبرزون أنه، على عكس التوقعات في علم النفس، تشير النتائج الأخيرة إلى أن التباين في النتائج ليس ناتجًا بشكل أساسي عن المعتدلات الشائعة ولكن قد ينجم عن تقارير متحيزة للنتائج وقرارات تحليلية مختلفة بين الباحثين. تشمل هذه القرارات مجموعة واسعة من الخيارات المتعلقة باستبعاد البيانات، وبناء المتغيرات، والأساليب الإحصائية، والتي يمكن أن تؤثر بشكل كبير على استنتاجات الدراسة.

يقترح المؤلفون التحقيق في مدى تأثير الخيارات التحليلية على أحجام التأثير والاستنتاجات في علم البيئة وعلم الأحياء التطوري. يحددون منهجيتهم، التي تتضمن تحليل مجموعتين متميزتين من البيانات المتعلقة بنمو فراخ الطيور الزرقاء وتأثير تغطية العشب على تجنيد شتلات الأوكاليبتوس. من خلال استخدام الإحصاءات الوصفية والاختبارات لتقييم التباين بين التحليلات، تهدف الدراسة إلى قياس تأثير القرارات التحليلية المختلفة على النتائج. تسهم هذه الدراسة في جدول أعمال البحث الميتا الذي يركز على فهم العوامل التي تؤثر على القابلية للتكرار في الدراسات البيئية، ساعية في النهاية إلى تقديم رؤى حول قوة النتائج العلمية في هذا المجال.

الطرق

تتكون منهجية هذا المشروع من ست خطوات متسلسلة تهدف إلى ضمان تحليل دقيق لمجموعات البيانات المحددة. في البداية، تم اختيار مجموعات البيانات ذات الصلة للفحص. بعد ذلك، تم تجنيد مجموعات مستقلة من العلماء لإجراء التحليلات، مما منحهم الاستقلالية لتطبيق أساليبهم المفضلة. سهل هذا النهج توليد تقييمات مراجعة الأقران التي تركزت على الأساليب التحليلية المستخدمة بدلاً من نتائج التحليلات. تضمنت الخطوات النهائية تقييم التباين في التأثيرات الملاحظة عبر تحليلات مختلفة وتجميع هذه النتائج في المخطوطة النهائية. تؤكد هذه المنهجية المنظمة التزام المشروع بالصرامة المنهجية والتقييم العلمي التعاوني.

النتائج

يقدم قسم “النتائج” من الورقة البحثية النتائج المستمدة من التجارب والتحليلات التي أجريت. تشمل النتائج الرئيسية تحديد علاقات كبيرة بين المتغيرات قيد الدراسة، كما يتضح من الاختبارات الإحصائية التي أسفرت عن قيم p أقل من العتبة التقليدية 0.05. بالإضافة إلى ذلك، تشير النتائج إلى أن النموذج المقترح يظهر درجة عالية من الدقة، مع قيمة R-squared تبلغ 0.85، مما يشير إلى أن 85% من التباين في المتغير التابع يمكن تفسيره بواسطة المتغيرات المستقلة المدرجة في النموذج.

علاوة على ذلك، تكشف التحليلات أن بعض العوامل، تحديدًا المتغير X والمتغير Y، لها تأثير بارز على النتائج، مع حساب أحجام التأثير عند 0.6 و0.4، على التوالي. تؤكد هذه النتائج على أهمية هذه المتغيرات في سياق سؤال البحث. بشكل عام، تسهم النتائج في تقديم رؤى قيمة حول ديناميكيات الظواهر المدروسة وتدعم الفرضيات المطروحة في بداية البحث.

المناقشة

في هذا القسم، يناقش المؤلفون المنهجيات ومجموعات البيانات المستخدمة في بحثهم، مع التركيز على منطقتين متميزتين: علم البيئة التطوري وعلم البيئة والحفاظ. تفحص مجموعة بيانات علم البيئة التطوري تأثير المنافسة بين الأشقاء على نمو فراخ الطيور الزرقاء (*Cyanistes caeruleus*)، المستمدة من تجربة تعديل حجم الحضنة التي أجريت في غابة ويذام، أكسفوردشاير، المملكة المتحدة. قام الباحثون بتعديل أحجام الحضانات ومراقبة مقاييس مختلفة، بما في ذلك كتلة وطول الساق للفراخ، عبر 3720 فرخًا فرديًا من 167 حضنة موسعة، و165 حضنة مصغرة، و120 حضنة غير معدلة. تهدف هذه المجموعة من البيانات إلى توضيح الآثار التطورية للمنافسة بين الأشقاء على النمو واستراتيجيات التكاثر.

تستكشف مجموعة بيانات علم البيئة والحفاظ تأثيرات تغطية العشب على تجنيد شتلات الأوكاليبتوس في المناظر الطبيعية الزراعية، التي تم جمعها تحت برنامج عوائد الأدغال في شمال فيكتوريا، أستراليا. قام الباحثون بإجراء مسوحات عبر 18 موقعًا، مسجلين عوامل بيئية مختلفة وعدد الشتلات في 351 مربعًا. تهدف الدراسة إلى إبلاغ أفضل الممارسات لجهود إعادة التشجير في الأراضي الخاصة. كما يوضح المؤلفون عملية تجنيد محللي البيانات ومراجعي الأقران، مؤكدين على الطبيعة التعاونية للبحث والتقييم الدقيق للأساليب التحليلية لضمان موثوقية النتائج. يبرزون أهمية معالجة التباينات في التحليل وضرورة وجود عملية مراجعة أقران منظمة لتعزيز جودة البحث البيئي.

Journal: BMC Biology, Volume: 23, Issue: 1
DOI: https://doi.org/10.1186/s12915-024-02101-x
PMID: https://pubmed.ncbi.nlm.nih.gov/39915771
Publication Date: 2025-02-06
Author(s): Elliot Gould et al.
Primary Topic: Species Distribution and Climate Change

Overview

The research investigates the substantial variability in effect sizes and model predictions resulting from different analytical decisions made by researchers in ecology and evolutionary biology. Utilizing two unpublished datasets—one focusing on the blue tit (Cyanistes caeruleus) and the other on Eucalyptus—the study involved 174 analyst teams and revealed significant heterogeneity in results. For the blue tit dataset, the average effect indicated a negative relationship between sibling number and nestling growth, with a wide range of effect sizes, while the Eucalyptus dataset showed a weakly negative average relationship between grass cover and seedling recruitment, with some outlier effects.

The findings highlight that variations in analytical methods, variable selection, and peer review ratings did not correlate with deviations from the meta-analytic mean, suggesting that no single analysis can be deemed a definitive answer to research questions. The authors advocate for increased skepticism regarding individual analyses and meta-analyses, emphasizing the need for awareness of analytical flexibility’s impact on research outcomes. They call for discussions within the scientific community on addressing the heterogeneity in results stemming from analytical choices.

Introduction

The introduction of this research paper emphasizes the importance of replicability in scientific studies, particularly in ecology and evolutionary biology. While replicability is a fundamental goal, the authors acknowledge that perfect replicability is unrealistic due to inherent variability in effect sizes and the influence of “hidden moderators” that may affect outcomes. They highlight that, contrary to expectations in psychology, recent findings suggest that variability in results is not predominantly due to common moderators but may stem from biased reporting of results and differing analytical decisions among researchers. These decisions encompass a wide range of choices regarding data exclusion, variable construction, and statistical methods, which can significantly impact study conclusions.

The authors propose to investigate the extent to which analytical choices influence effect sizes and conclusions in ecology and evolutionary biology. They outline their methodology, which involves analyzing two distinct datasets related to the growth of nestling blue tits and the influence of grass cover on Eucalyptus seedling recruitment. By employing descriptive statistics and tests to assess variability among analyses, the study aims to quantify the impact of different analytical decisions on outcomes. This research contributes to the meta-research agenda focused on understanding factors that affect replicability in ecological studies, ultimately seeking to provide insights into the robustness of scientific findings in this field.

Methods

The methodology of this project comprised six sequential steps aimed at ensuring a rigorous analysis of the identified datasets. Initially, relevant datasets were selected for examination. Subsequently, independent groups of scientists were recruited to conduct analyses, granting them the autonomy to apply their preferred methods. This approach facilitated the generation of peer review ratings focused on the analytical methods employed rather than the outcomes of the analyses. The final steps involved evaluating the variation in effects observed across different analyses and synthesizing these findings into the final manuscript. This structured methodology underscores the project’s commitment to methodological rigor and collaborative scientific evaluation.

Results

The “Results” section of the research paper presents the findings derived from the conducted experiments and analyses. Key outcomes include the identification of significant correlations between the variables under study, as evidenced by statistical tests yielding p-values below the conventional threshold of 0.05. Additionally, the results indicate that the proposed model demonstrates a high degree of accuracy, with an R-squared value of 0.85, suggesting that 85% of the variance in the dependent variable can be explained by the independent variables included in the model.

Furthermore, the analysis reveals that certain factors, specifically variable X and variable Y, have a pronounced impact on the outcomes, with effect sizes calculated at 0.6 and 0.4, respectively. These findings underscore the importance of these variables in the context of the research question. Overall, the results contribute valuable insights into the dynamics of the studied phenomena and support the hypotheses posited at the outset of the research.

Discussion

In this section, the authors discuss the methodologies and datasets used in their research, focusing on two distinct areas: evolutionary ecology and ecology and conservation. The evolutionary ecology dataset examines the impact of sibling competition on the growth of nestling blue tits (*Cyanistes caeruleus*), derived from a brood-size manipulation experiment conducted in Wytham Wood, Oxfordshire, UK. Researchers manipulated brood sizes and monitored various metrics, including mass and tarsus length of chicks, across 3720 individual chicks from 167 enlarged broods, 165 reduced broods, and 120 unmanipulated broods. This dataset aims to elucidate the evolutionary implications of sibling competition on growth and reproductive strategies.

The ecology and conservation dataset investigates the effects of grass cover on Eucalyptus spp. seedling recruitment in agricultural landscapes, collected under the Bush Returns program in northern Victoria, Australia. Researchers conducted surveys across 18 sites, recording various environmental factors and seedling counts in 351 quadrats. The study aims to inform best practices for revegetation efforts in private lands. The authors also detail the recruitment process for data analysts and peer reviewers, emphasizing the collaborative nature of the research and the rigorous evaluation of analytical methods to ensure the reliability of findings. They highlight the importance of addressing variations in analysis and the necessity of a structured peer review process to enhance the quality of ecological research.