البدء في نموذج الاستجابة المتدرجة: مقدمة ودليل في R
Getting started with the graded response model: An introduction and tutorial in R

المجلة: International Journal of Psychology، المجلد: 60، العدد: 1
DOI: https://doi.org/10.1002/ijop.13265
PMID: https://pubmed.ncbi.nlm.nih.gov/39530209
تاريخ النشر: 2024-11-12
المؤلف: Rizqy Amelia Zein وآخرون
الموضوع الرئيسي: طرق إحصائية واستدلال بايزي

نظرة عامة

تقدم هذه القسم نظرة عامة على نموذج الاستجابة المتدرجة (GRM)، وهو أداة قياس ضمن إطار نظرية استجابة العناصر (IRT)، تهدف إلى تعزيز دقة التقييمات النفسية. تم تصميم البرنامج التعليمي للباحثين التطبيقيين ويركز على إجراء تحليل GRM أحادي البعد باستخدام بيئة برمجة R، مع الاستفادة بشكل خاص من حزم psych وmirt وggmirt.

نموذج GRM مناسب بشكل خاص لتقييم الخصائص السيكومترية للمقاييس التي تتضمن عناصر متعددة الخيارات، مثل تلك المعتمدة على استجابات من نوع ليكرت. يستخدم البرنامج التعليمي بيانات من قاعدة بيانات علم النفس المفتوحة، مع التركيز بشكل خاص على مقياس السلطوية اليمينية (RWA). يوضح الأسس النظرية لنموذج GRM، إلى جانب الخطوات العملية لإعداد البيانات، واختبار فرضيات النموذج، وتناسب النموذج، ورسم وتفسير معلمات العناصر، مما يوفر دليلاً شاملاً للباحثين في هذا المجال.

نقاش

في قسم النقاش، يقارن البحث بين نظرية الاختبار الكلاسيكية (CTT) ونظرية استجابة العناصر (IRT) في سياق القياس النفسي. تقوم CTT بتفكيك الدرجات الملاحظة إلى درجات حقيقية وأخطاء قياس، مع افتراض وجود علاقة خطية بينها، مما قد يحد من قابليتها للتطبيق، خاصة في تفسير الدرجات الفردية. في المقابل، تقوم IRT بنمذجة هذه العلاقة بشكل احتمالي، مما يسمح بفهم دقيق لخصائص العناصر مثل الصعوبة والتمييز. يتيح هذا الإطار الاحتمالي حساب الأخطاء المعيارية الفردية للقياس، مما يوفر تقييماً أكثر موثوقية عبر مستويات مختلفة من السمة الكامنة (????). على سبيل المثال، توضح تحليل مقياس الرباعي المظلم القصير (SD4) أن بعض المقاييس الفرعية قد تكون موثوقة فقط لمجالات محددة من السمة التي يتم قياسها.

يتناول البحث بشكل أكبر نموذج الاستجابة المتدرجة (GRM)، وهو نموذج IRT محدد مصمم للبيانات المتعددة الخيارات المرتبة، مثل مقاييس ليكرت. يوسع GRM نماذج IRT الثنائية من خلال تطبيق دالة احتمالية على كل فئة استجابة، مما يسمح بتقدير العتبات التي تشير إلى مستوى السمة الكامنة المطلوبة لتأييد فئات الاستجابة الأعلى. تشمل الافتراضات الرئيسية لنموذج GRM العلاقة الأحادية بين السمة الكامنة واحتمالات الاستجابة، والبعد الأحادي للسمة التي يتم قياسها، والاستقلال المحلي لاستجابات العناصر. يوضح البحث تطبيق نموذج GRM باستخدام مقياس السلطوية اليمينية (RWA)، موضحاً كيفية تقييم البعد وتناسب النموذج من خلال تحليل العوامل الاستكشافية (EFA) وتحليل GRM اللاحق. يبرز هذا النهج أهمية استخدام نماذج IRT لتعزيز دقة وقابلية تفسير القياسات النفسية.

Journal: International Journal of Psychology, Volume: 60, Issue: 1
DOI: https://doi.org/10.1002/ijop.13265
PMID: https://pubmed.ncbi.nlm.nih.gov/39530209
Publication Date: 2024-11-12
Author(s): Rizqy Amelia Zein et al.
Primary Topic: Statistical Methods and Bayesian Inference

Overview

This section provides an overview of the graded response model (GRM), a measurement tool within the item response theory (IRT) framework, aimed at enhancing the precision of psychological assessments. The tutorial is designed for applied researchers and focuses on conducting a unidimensional GRM analysis using the R programming environment, specifically utilizing the psych, mirt, and ggmirt packages.

The GRM is particularly suited for evaluating the psychometric properties of scales that include polytomous items, such as those based on Likert-type responses. The tutorial employs data from the Open Psychometrics Database, specifically examining the right-wing authoritarianism (RWA) scale. It details the theoretical foundations of GRM, along with practical steps for data preparation, model assumption testing, model fitting, and the plotting and interpretation of item parameters, thereby providing a comprehensive guide for researchers in the field.

Discussion

In the discussion section, the paper contrasts Classical Test Theory (CTT) and Item Response Theory (IRT) in the context of psychological measurement. CTT decomposes observed scores into true scores and measurement errors, assuming a linear relationship between them, which can limit its applicability, especially for individual score interpretation. In contrast, IRT models this relationship probabilistically, allowing for a nuanced understanding of item characteristics such as difficulty and discrimination. This probabilistic framework enables the calculation of individual standard errors of measurement, thus providing a more reliable assessment across varying levels of the latent trait (????). For example, the analysis of the Short Dark Tetrad (SD4) scale illustrates that certain subscales may be reliable only for specific ranges of the trait being measured.

The paper further elaborates on the Graded Response Model (GRM), a specific IRT model designed for ordered polytomous data, such as Likert scales. GRM extends the dichotomous IRT models by applying a probabilistic function to each response category, allowing for the estimation of thresholds that indicate the level of the latent trait required to endorse higher response categories. Key assumptions of GRM include the monotonic relationship between the latent trait and response probabilities, unidimensionality of the trait being measured, and local independence of item responses. The paper exemplifies the application of GRM using the Right-Wing Authoritarianism (RWA) scale, demonstrating how to assess dimensionality and model fit through exploratory factor analysis (EFA) and subsequent GRM analysis. This approach underscores the importance of using IRT models to enhance the precision and interpretability of psychological measures.