ترجمة، التكيف عبر الثقافات، والتحقق من أدوات القياس: دليل عملي للباحثين المبتدئين Translation, Cross-Cultural Adaptation, and Validation of Measurement Instruments: A Practical Guideline for Novice Researchers

المجلة: Journal of Multidisciplinary Healthcare
DOI: https://doi.org/10.2147/jmdh.s419714
PMID: https://pubmed.ncbi.nlm.nih.gov/38840704
تاريخ النشر: 2024-05-01

ترجمة، التكيف عبر الثقافات، والتحقق من أدوات القياس: دليل عملي للباحثين المبتدئين

باولو كروتشينيو ، ماريا دولوريس لوبيز-فرانكو ، مانويل لويس كابيلاس ، صوفيا ألميدا ، فيليبا ماي بينيت ، مارسيل ميراندا دا سيلفا ، جيزيلا تيكسيرا ، إليزابيت نونيس ، بيدرو لوكاس (1) ، فيلومينا غاسبار (1) بالنيابة عن Handovers4SafeCare مركز أبحاث التمريض والابتكار والتطوير (CIDNUR) في لشبونة، كلية التمريض في لشبونة، لشبونة، البرتغال؛ CTS-464 التمريض والابتكار في الرعاية الصحية، جامعة خين، خين، إسبانيا؛ الجامعة الكاثوليكية البرتغالية، كلية العلوم الصحية والتمريض، مركز البحث بين التخصصات في الصحة (CIIS)، لشبونة، البرتغال؛ الجامعة الكاثوليكية البرتغالية، كلية العلوم الصحية والتمريض، مركز البحث بين التخصصات في الصحة (CIIS)، بورتو، البرتغال؛ مركز الدراسات الإنجليزية والترجمة والدراسات الأنجلو-برتغالية (CETAPS)، لشبونة، البرتغال؛ كلية العلوم الاجتماعية والإنسانية في الجامعة الجديدة في لشبونة، لشبونة، البرتغال؛ كلية الآداب والعلوم الإنسانية في جامعة كويمبرا، قسم اللغات والأدب والثقافات، كويمبرا، البرتغال؛ الجامعة الفيدرالية في ريو دي جانيرو، مدرسة آنا نيري للتمريض، ريو دي جانيرو، البرازيلالمراسلة: باولو كروتشينيو، كلية التمريض في لشبونة، Avenida Prof. Egas Moniz، لشبونة، 1600-190، البرتغال، هاتف +35I 217913400، بريد إلكتروني pjcruchinho@esel.pt

الملخص

التحقق عبر الثقافات من أدوات القياس المبلغ عنها ذاتيًا للبحث هو عملية طويلة ومعقدة، تتضمن مخاطر محددة من التحيز التي قد تؤثر على عملية البحث والنتائج. علاوة على ذلك، يتطلب من الباحثين أن يكون لديهم مجموعة واسعة من المعرفة التقنية حول جوانب الترجمة والتكيف والاختبار المسبق، وأغراضها وخياراتها، حول الخصائص السيكومترية المختلفة، والأدلة المطلوبة لتقييمها ومعرفة معالجة البيانات الكمية وتحليلها باستخدام البرمجيات الإحصائية. كان الهدف من هذه المقالة: 1) تحديد جميع الإرشادات والتوصيات للترجمة، التكيف عبر الثقافات، والتحقق ضمن علوم الرعاية الصحية؛ 2) وصف المناهج المنهجية التي تم وضعها في هذه الإرشادات لإجراء الترجمة، التكيف، والتحقق عبر الثقافات؛ و 3) تقديم دليل عملي يتضمن خيارات منهجية متنوعة للباحثين المبتدئين المشاركين في ترجمة، تكيف، والتحقق من أدوات القياس. تم الحصول على اثنين وأربعين إرشادًا حول الترجمة، التكيف، أو التحقق عبر الثقافات من أدوات القياس من “CINAHL مع النص الكامل” (عبر EBSCO) و”MEDLINE مع النص الكامل”. تم إجراء تحليل محتوى لتحديد أوجه التشابه والاختلاف في المناهج المنهجية الموصى بها. بناءً على هذه التشابهات والاختلافات، اقترحنا دليلًا من ثمانية خطوات يتضمن: أ) الترجمة الأمامية؛ 2) تجميع الترجمات؛ 3) الترجمة العكسية؛ 4) التوافق؛ 5) الاختبار المسبق؛ 6) الاختبار الميداني؛ 7) التحقق السيكومتري، و 8) تحليل الخصائص السيكومترية. إنه دليل عملي لأنه يوفر معلومات شاملة وواسعة حول المناهج المنهجية المتاحة للباحثين. هذه هي أول مراجعة أدبية منهجية تُجرى في علوم الرعاية الصحية بشأن المناهج المنهجية الموصى بها من قبل الإرشادات الموجودة.

الكلمات الرئيسية: المقارنة عبر الثقافات، اتخاذ القرار، الخصائص السيكومترية، تصميم البحث، دراسات التحقق، أبحاث خدمات الصحة

المقدمة

تتطلب أبحاث الرعاية الصحية استخدام أدوات تم التحقق منها عبر الثقافات لقياس تنفيذ التدخلات الصحية ونتائجها من خلال مقارنات كمية على مر الزمن وعبر المنظمات. يسمح استخدام البيانات التي تم الحصول عليها من خلال أدوات التقييم المعدلة ثقافيًا للباحثين وصانعي السياسات والمديرين والمهنيين الصحيين بالحصول على رؤية تحليلية أكثر للظواهر قيد الدراسة وتطوير نظريات مقبولة ومعترف بها دوليًا حول تقديم رعاية المرضى، بناءً على مقارنة البيانات المحلية مع البيانات الأوسع. تسهل هذه المقاربة أيضًا تحديد العوامل التي تساهم في فعالية برامج التدخلات الصحية، أو أشكال أخرى من أبحاث النتائج. يتطلب هذا النوع من البحث الكمي، الذي يركز على جودة تقديم الرعاية الصحية، أدوات قياس صالحة و
موثوقة، تم الحصول عليها من خلال دراسات التحقق عبر الثقافات. تهدف هذه الدراسات إلى تأكيد قدرة أدوات القياس التي تم تطويرها في ثقافة واحدة على إنتاج نتائج ذات مغزى عند تطبيقها في ثقافة أخرى. يمكن أن تشمل أدوات القياس الاستبيانات، الاختبارات، مقاييس التقييم والتقارير الذاتية، الأخيرة تُعرف أيضًا بمقاييس النتائج المبلغ عنها من قبل المرضى (PROMs).
في السنوات الأخيرة، قمنا بإجراء عدة دراسات للتحقق عبر الثقافات لأدوات قياس مختلفة، والتي تشكل مساهمة كبيرة في تطوير التصاميم التجريبية في مجال التمريض وأبحاث خدمات الصحة. تتميز العديد من الدراسات عبر مجالات علمية مختلفة باستخدام مصطلحات محددة والسعي لأرشفة مختلف المعادلات عبر الثقافات. بالإضافة إلى ذلك، تتضمن دراسات التحقق عبر الثقافات عملية طويلة ومعقدة تتطلب من الباحثين أن يكون لديهم معرفة تقنية واسعة حول جوانب الترجمة، الترجمة العكسية، التكيف، والاختبار المسبق، وأغراضها وخياراتها، والخصائص السيكومترية المختلفة، والأدلة المطلوبة لتقييمها ومعرفة معالجة البيانات الكمية وتحليلها باستخدام البرمجيات الإحصائية. علاوة على ذلك، تتضمن هذه الدراسات مخاطر محددة من التحيز، والتي قد تؤثر على عملية البحث والنتائج. لمواجهة هذه التحديات، يجب أن يكون الباحثون المبتدئون على دراية جيدة بأكثر المناهج المنهجية ملاءمة.

المفاهيم والمصطلحات المحددة

إن التكيف واختبار أدوات القياس عبر سياقات دولية مختلفة على مر الزمن، لا يعزز فقط موثوقيتها وصلاحيتها، بل يسهل أيضًا المقارنات بين الثقافات وتحديد العوامل ذات الصلة لتطوير تدخلات فعالة. لا يقتصر التكيف عبر الثقافات على ترجمة أدوات القياس. بل يشمل التكيف والتحقق من هذه الأدوات في السياق الثقافي الذي يُقصد استخدامها فيه.
تُستخدم بعض المصطلحات المحددة في عملية التكيف عبر الثقافات. على سبيل المثال، فإن “الإصدار المستهدف” من أداة قياس معينة هو الإصدار الذي سيتم إنشاؤه من خلال عملية التكيف الثقافي و”اللغة المستهدفة” تتكون من اللغة التي يُقصد بها التكيف. “الإصدار الأصلي” هو الإصدار من الأداة التي ينوي الباحثون تعديلها و”اللغة المصدر” هي لغة “الإصدار الأصلي”. المترجمون ثنائيو اللغة في عملية التكيف عبر الثقافات هم الأفراد الذين لديهم إتقان كامل لكل من “اللغة المستهدفة” و”اللغة الأصلية”. تشمل الترجمة تحويل مستند من “اللغة المصدر” إلى “اللغة المستهدفة”، مع مراعاة الجمهور المستهدف، الثقافة المستهدفة، والغرض (الملخص أو الغرض التواصلي). في حالة ترجمة أدوات الصحة، يشمل ذلك عوامل مثل الدقة، الطلاقة، والتكافؤ المفهومي، ولكن أيضًا، كما جادل مونتال وديفيس، الأولوية الأخلاقية لـ “الأهمية الثقافية”، بينما يتضمن التكيف عبر الثقافات تحديد الاختلافات بين “الثقافة المصدر” و”الثقافة المستهدفة” للحفاظ على تكافؤ المفاهيم. أخيرًا، يهدف التحقق عبر الثقافات إلى ضمان أن “الأداة المستهدفة” تعمل كما هو مقصود ولها نفس الخصائص مثل “الأداة الأصلية”. ضمن التحقق عبر الثقافات، يمكننا التمييز بين التحقق النفسي الذي يتم بعد اختبار الميدان والتحقق الذي يتم خلال الاختبار المسبق، والذي يهدف إلى التحقق من النسخة المعدلة قبل استخدامها الاستكشافية.

أنواع المعادلة

الغرض من التكيف عبر الثقافات يتكون من الحصول على أداة قياس في “اللغة المستهدفة” تكون معادلة من الناحية المفاهيمية للأصل. قبل أن يختار الباحثون نهجًا منهجيًا معينًا لترجمة وتكييف والتحقق عبر الثقافات لأدوات القياس، من الضروري فهم الأنواع المختلفة من المعادلة التي يمكن تحقيقها بين “النسخة المستهدفة” و”النسخة الأصلية”.
يمكن تحديد المعادلة في فئات مختلفة تتفاوت وفقًا للمؤلفين. هيردمان وآخرون اقترح مجموعة من خمس فئات: 1) التكافؤ المفهومي؛ 2) التكافؤ العنصري؛ 3) التكافؤ الدلالي؛ 4) التكافؤ التشغيلي و 5) تكافؤ القياس. يتحقق التكافؤ المفهومي من المجالات والعلاقات المتبادلة التي تعتبر مهمة في “الثقافة المستهدفة” بالنسبة للمفهوم المعني الذي يتم تقييمه بواسطة الأداة. يقوم التكافؤ العنصري بفحص العناصر التي تغطيها مجالات المفهوم بشكل نقدي، بينما يضمن التكافؤ الدلالي أن ترجمات العناصر تتطابق دلالياً مع العناصر في “الإصدار الأصلي”. يسعى التكافؤ التشغيلي إلى ضمان أن طرق القياس المستخدمة مناسبة في “الثقافة المستهدفة” ويتعلق تكافؤ القياس بالتحقق من نتيجة العملية بالإشارة إلى سلوك الأداة المتعلق بخصائصها النفسية. كل واحدة من هذه الفئات مهمة للحكم على التكافؤ العام لأدوات القياس، أي تكافؤها الوظيفي. بينا وصف فئات أخرى من المعادلات، وهي: 1) المعادلة الوظيفية؛ 2) المعادلة الثقافية؛ 3) المعادلة المترية و 4) المعادلة اللغوية. الأخيرة تتوافق مع الدلالي
معادلة هيردمان وآخرون تقييم المعادلة الوظيفية يحدد ما إذا كانت الأداة لها نفس السلوك في الثقافتين. المعادلة الثقافية تحدد كيف سيجيب المشاركون على عنصر معين يحمل نفس المعنى الثقافي. أخيرًا، تتعلق معادلة القياس بصعوبة التعبير عن عنصر معين بلغتين مختلفتين. وفقًا لبيانا، تعتمد المعادلات التي يجب الحصول عليها في التكيف الثقافي لأدوات القياس على أهداف الدراسات. لتحديد أي المعادلات يتم الحصول عليها، قد يختار الباحثون واحدة من هاتين الفئتين. إن فهم الفئات المختلفة من المعادلة يمكّن الباحثين من تصميم نهج منهجي لإجراءات التكيف عبر الثقافات يتناسب مع أنواع المعادلة المطلوبة. إذا اعتمد الباحثون نهجًا منهجيًا موحدًا اقترحه مؤلف، فإنه يتيح لهم أيضًا تكملة العملية بإجراءات أخرى تتناسب بشكل أفضل مع خصائص أداة القياس الخاصة بهم والسكان المستهدفين. يتم ذلك بهدف تحقيق أو تعزيز نوع معين من المعادلة في الأداة.

أنماط التحيزات

عنصر آخر يحتاج الباحثون إلى فهمه قبل البدء في الترجمة والتكيف والتحقق من صحة الأدوات القياسية عبر الثقافات هو خطر التحيز. تشكل التحيزات الثقافية التهديد الرئيسي لهذه العملية. تعتبر الأداة القياسية متحيزة إذا تأثرت نسختان ثقافيتان أو أكثر عن غير قصد بمصدر غير مرغوب فيه من التباين، الناتج عن: 1) الاختلافات في المفاهيم بين “الثقافة المصدر” و”الثقافة المستهدفة”؛ 2) الاختلاف بين العناصر المستخدمة لتمثيل البنى في الأدوات و 3) الطريقة أو الشكل المستخدم في الإدارة. تُصنَّف التحيزات الثقافية إلى تحيزات منهجية، وتحيازات محتوى، وتحيازات بناء استنادًا إلى أسبابها. تتمثل إحدى التحديات في التكيف عبر الثقافات لأدوات القياس في إدارة أنماط الاستجابة المختلفة عبر الثقافات، وهي الاستجابة الإيجابية، وتأثيرات السقف والأرض، والميول نحو الاستجابات المحايدة. قد تكون هذه الاختلافات في أنماط الاستجابة مصدرًا لتحيز المنهج. وقد تكون أكثر تعبيرًا في ثقافات معينة من غيرها ومرتبطة بالحاجة إلى حماية الهوية والخصوصية، بسبب وجود مستويات منخفضة من دافعية المشاركين وتقدير المعايير الاجتماعية للتهذيب. يمكن أن يتم إدخال تحيز المحتوى من خلال عناصر يكون محتواها غير مألوف لـ”الثقافة المستهدفة”. بينما يحدث انحياز البناء عندما يكون هناك تساوي جزئي فقط في البناء الذي يتم قياسه بين الثقافات.
لتخفيف هذه التحيزات الثقافية خلال التكيف عبر الثقافات، يمكن للباحثين استخدام عدة استراتيجيات. إحدى الاستراتيجيات هي اختبار الأداة مسبقًا مع عينة من المشاركين من “الثقافة المستهدفة”. تتضمن استراتيجية أخرى إجراء مقابلات مع المشاركين بعد الاختبار المسبق لتقييم خصائصهم وأدائهم. على الرغم من عدم وجود أدلة قوية لمنع تحيز الأسلوب، قد يلجأ الباحثون إلى أ) تنسيقات استجابة اختيارية قسرية بدون نقاط محايدة وسطية و ب) استخدام مقاييس ليكرت مع عدد موسع من خيارات الاستجابة. على سبيل المثال، يُعتبر استخدام تنسيقات استجابة من 5 إلى 7 نقاط مناسبًا لقياس المواقف. لتوفير الوقت والموارد، من المهم أن يحدد الباحثون مخاطر أي من هذه التحيزات في أقرب وقت ممكن، ويفضل قبل إجراء الاختبارات الأولية.

النهج المنهجية

يتطلب ترجمة وتكييف وتقييم الأدوات إرشادات منهجية تم تطويرها واقتراحها من قبل باحثين ذوي خبرة. على الرغم من ذلك، فإن العديد من دراسات التحقق لا تذكر ما إذا كانت قد اعتمدت إرشادات مقبولة دوليًا لعملها. لقد أشار بعض المؤلفين إلى نقص المعلومات التفصيلية حول أساسيات المناهج والأساليب والخيارات المتاحة للباحثين. لقد أفادت مراجعات الأدبيات أيضًا بوجود نقص في التوافق بشأن الأساليب المنهجية التي يجب اتباعها في عملية الترجمة والتكيف والتحقق عبر الثقافات. تش وآخرون نسبت هذه الفجوة في التوافق ليس فقط إلى خصوصية أسئلة البحث ولكن أيضًا إلى بيئة البحث، وهي إمكانية الوصول وتوافر المترجمين الثنائيي اللغة. فارينا وآخرون لقد أظهرت مؤخرًا أن التكيف الثقافي الصارم والعملي يمكن تحقيقه بموارد محدودة. في مواجهة نقص الإجماع، إيبستين وآخرون يوصى باختيار الطرق التي تناسب السياق الذي سيتم فيه استخدام أداة التقييم. فوروكاوا وآخرون أشاروا إلى أن هذا الاختيار يعتمد على أهداف البحث، وتوافر المترجمين، والميزانية، والقيود الزمنية. بالإضافة إلى ذلك، هيلمش وآخرون أوصى بأنه من أجل تحقيق نتائج تعكس السياق بشكل حقيقي، يجب أن تتماشى طرق البحث مع الموقف الإبستمولوجي للباحثين.
على الرغم من عدم وجود توافق، تشترك الإرشادات في بعض العناصر المشتركة. في مراجعة أدبية أجراها أكوادرو وآخرون، تم العثور على أنه من أجل التكيف عبر الثقافات لأدوات قياس النتائج الذاتية (PROMs)، تتشارك الإرشادات في عملية مركزية متعددة الخطوات، تتضمن على الأقل ترجمة واحدة ونوعًا من الاختبار المسبق. فيما يتعلق بالاستبيانات بشكل عام،
إيبستين وآخرون لوحظ أن معظم الإرشادات توصي بتشكيل لجنة خبراء، ومجموعات تركيز، وترجمة عكسية للأداة.
يجب أن تغطي الإرشادات ليس فقط الترجمة والتكيف عبر الثقافات ولكن أيضًا التحقق النفسي. وقد أفادت بعض المراجعات بوجود نقص في المعرفة حول الخصائص النفسية للأدوات القياسية المعدلة. ومعلومات غير مكتملة عن جميع مجالات التحقق النفسي. على سبيل المثال، دانييلسن وآخرون وجدت أن الخصائص النفسية للإصدارات المعدلة التي تم التحقق من صحتها مع اختبارات مختلفة، أوصت بإدراج مرحلة تحقق كمية تشمل اختبارًا أو أكثر تركز على صلاحية المحتوى، صلاحية المعايير، الموثوقية وصلاحية البناء. بالإضافة إلى ذلك، في مراجعة استكشافية لـ ياردن وآخرون فيما يتعلق بأدوات القياس لضغط الآباء خلال فترة ما بعد الولادة، تم الإبلاغ عن أن أيًا من الأدوات الخمسة عشر لم تحتوي على معلومات حول خطأ القياس، والاستجابة، وقابلية التفسير. إتشيفاريا-غوانيلو وآخرون يجادلون بأن الباحثين يجب أن يكون لديهم معرفة شاملة بالخصائص النفسية ليتناسب تصميم البحث مع الخصائص النفسية الأكثر ملاءمة للأداة المعنية.
فيما يتعلق بالنهج المنهجية، حدد ماتشادو وآخرون أكثر طرق التكيف الثقافي استخدامًا في التمريض، ووجدوا دراسات حيث أضاف الباحثون نهجًا منهجيًا إلى الطريقة التي اتبعوها ودراسات حيث لم يمتثل الباحثون لجميع الخطوات المنهجية المحددة. كروشينيو وآخرون في دراسة قيمت النهج المنهجية المستخدمة في عملية الترجمة والتكيف الثقافي لاستبيان مواقف وسلوكيات تسليم السرير (BHAB) أبلغوا عن الاستخدام التكميلي للتركيز المزدوج لزيادة التكافؤ المفهومي بين “النسخة المصدر” و”النسخة المستهدفة”. يُعرف النهج المنهجي بأنه الطريقة التي يتم بها دراسة ظاهرة ما بشكل منهجي، مشكّلة من قبل الأطر الوجودية والمعرفية للباحثين. عند تطبيقها على دراسات التحقق الثقافي، يمكن تعريفها على أنها طريقة لدراسة التكافؤات التي يُراد تحقيقها من خلال الترجمة، والتكيف، والتحقق من أدوات القياس.
في التكيف الثقافي للأدوات، يمكن استخدام طرق منهجية مختلفة للترجمة، مثل: 1) الترجمة الأحادية؛ 2) نهج اللوحة المزدوجة، و3) الترجمة الأمامية والخلفية. الترجمة الأحادية هي أسرع وأرخص طريقة، حيث تشمل فقط الأفراد ثنائيي اللغة الذين يترجمون الأداة إلى “اللغة المستهدفة”. الترجمة الأمامية والخلفية هي الطريقة الأكثر توصية في إرشادات الترجمة. تتطلب على الأقل مترجمين مستقلين: واحد يترجم الأداة إلى “اللغة المستهدفة”، والآخر يترجم هذه النسخة مرة أخرى إلى “اللغة المصدر”. نهج اللوحة المزدوجة هو نوع من نهج اللجنة يتضمن ترجمة توافقية من قبل مجموعة من ثنائيي اللغة الأصليين للغة “المستهدفة”، إلى جانب عضو من فريق البحث يقوم بتكييف أداة القياس. ثم يتم مراجعة هذه النسخة التوافقية من قبل مجموعة ثانية من أعضاء السكان المستهدفين أحاديي اللغة. يمكن أن تشمل أيضًا مجموعة ثالثة لترجمة النسخة المترجمة مرة أخرى إلى “اللغة المصدر”. وجد لي وآخرون أن كل من طرق الترجمة الأمامية والخلفية وطرق اللوحة المزدوجة تمكّن من إنتاج ترجمات متكافئة دلاليًا وتبرز أن الترجمة وحدها لا يمكن أن تقضي على الفروق الثقافية.
دراسة باباداكيس وآخرون التي قارنت الترجمات من قبل مترجمين ذوي خصائص مختلفة، أكدت على أهمية أن يكون المترجمون يفضل أن يكونوا ثنائيي الثقافة ولديهم بعض المعرفة بالمحتوى للأدوات، ويفضل أن يتم اختيارهم من السكان المستهدفين. المعرفة العميقة بالسياقات اليومية (المعتقدات، القيم، العادات، الرموز، التعبيرات) تمكّن الثقافة من أن تُختزل إلى مجموعة من المتغيرات الأساسية لبناء معين وتسهّل البحث عبر الثقافات. يمكن أن يكون أعضاء السكان المستهدفين مرضى ذوي مهارات القراءة والكتابة لتعزيز التكيف الثقافي. بالإضافة إلى ذلك، خلص باباداكيس وآخرون إلى أن تحليل المكونات الرئيسية لأدوات القياس هو منهجية يمكن استخدامها لمقارنة الترجمات التي قام بها مترجمون ذوو ملفات تعريف مختلفة.
يمكن أن تكون النهج المنهجية للترجمة متماثلة أو غير متماثلة. تهدف الترجمات المتماثلة إلى جعل الأداة ذات صلة ثقافيًا بالسكان المستهدفين، بينما تتوافق الترجمات غير المتماثلة مع الترجمات الحرفية وتحافظ على تطابق كلمة لكلمة. في دراسة وجدت بعض الارتباك بين المترجمين حول أي نهج يجب اتخاذه عند إجراء الترجمات الخلفية، سواء كانت أكثر غير متماثلة وحرفية أو أكثر متماثلة وقابلة للفهم في “الثقافة المستهدفة”، ذكر بوندغارد وبروغر، أن الإرشادات تقدم تعليمات محددة حول عملية الترجمة والاستراتيجية. كان ذلك لضمان وضوح معنى العناصر وتقليل التهديدات لصلاحية البناء. لتسهيل المفاوضات بين لجان المترجمين فيما يتعلق بفروق العناصر وبالتالي تقليل التهديدات لصلاحية البناء، اقترح مؤلفون آخرون تقديم وصف للنيات لكل من العناصر.
تشا وآخرون يجادل بأن نهج اللجنة يساهم في الحصول على معاملات اتساق داخلي مقبولة. في الوقت نفسه، وجد إبستين وآخرون أن إجراء لجنة خبراء متعددة التخصصات يساهم في الحصول على عناصر صارمة في تكييف أداة متعددة الأبعاد. عزز مؤلفون آخرون أهمية أنواع مختلفة من نهج اللجنة. على سبيل المثال، أبلغ تيغ وآخرون أن استخدام طريقة دلفي في لجنة خبراء مع معايير السرية، والتغذية الراجعة المنضبطة، والاستجابات الإحصائية، يوفر قياسًا أكثر دقة لدرجة التوافق بين جميع العناصر مقارنةً إذا تم عقد اجتماع دون أي نظام تصويت رسمي. تساي-تي وصف عملية التكيف الثقافي التي تضمنت مجموعة من الخبراء لتحديد صلاحية المحتوى للأداة الأصلية قبل ترجمتها إلى اللغة المستهدفة. أيضًا، ذكر جاياويكريمي وآخرون أهمية استخدام سلسلة مجموعات التركيز لتعزيز تقييم العناصر المترجمة من قبل مجموعة من الخبراء.
مونتينيغرو وآخرون سلطوا الضوء على أهمية استخدام التركيز المزدوج كاستراتيجية لإزالة المركزية في سياق نهج اللجنة. بعد الترجمة الأمامية والخلفية، قد يتم تحديد العناصر أو أجزاء من العناصر التي لا تناسب “الثقافة المستهدفة”. في هذه الحالات، يمكن استخدام إزالة المركزية والتركيز المزدوج. إزالة المركزية هي إجراء ترجمة لا تتطلب ترجمة حرفية، والتي تستخدم لتحقيق التكافؤ الاصطلاحي، والنحوي-التركيبي، والتجريبي والمفهومي بين الثقافتين. يتضمن التركيز المزدوج استبدال العناصر أو أجزاء من العناصر بأخرى أكثر ملاءمة في “اللغة المستهدفة” من أجل التخفيف من صعوبة تكييف محتوى معين من “الثقافة المصدر”. يسمح لنا بفحص ما يسعى كل من العناصر في “النسخة الأصلية” للأداة إلى تقييمه في ضوء التعريف التشغيلي للبناء الذي نريد قياسه، وبالتالي، ضمان أننا نهتم بصلاحية المحتوى. أبلغت عدة دراسات عن استبدال الكلمات والعناصر نتيجة لاستخدام التركيز المزدوج.
تم تبرير الأهمية المحددة لأنواع مختلفة من النهج المنهجية في الأدبيات العلمية. أبرز توما وآخرون أثر دمج الترجمات الخلفية مع الاختبار المعرفي (المعروف أيضًا بالمقابلات المعرفية والتفريغ المعرفي) في تعديل خمسة عناصر من أداة مع كل من هذه النهج. مقارنة نتائج التفريغ المعرفي مع الأداة الأصلية أمر ضروري لضمان الصلة الثقافية، حيث يمكن أن تكشف عن مشاكل في الصياغة، والتعبيرات، والتوافق مع وجهات نظر الأفراد. أوصى حسني وآخرون بإدراج التفريغ المعرفي في تصميم البحث مع نهج لجنة الخبراء لضمان صلاحية وموثوقية نموذج القياس. ومع ذلك، في مراجعة أدبية تكاملية قامت بتحليل كيفية وصف المترجمين الخلفيين في 105 دراسات تجريبية، وجد بوندغارد وبروغر معلومات محدودة حول مؤهلات المترجمين في الدراسات التجريبية.
الترجمة الخلفية هي النهج المنهجي الذي تم تبرير أهميته بطرق مختلفة. تم الدفاع عنها أولاً للحد من استبدال محتوى العناصر لأسباب ثقافية. لاحقًا، دافع باحثون آخرون عن استخدامها ليس كطريقة للتكافؤ، ولكن كوسيلة للتحقق من محتوى العناصر وهدف الأداة. في الآونة الأخيرة، تم الجدال حول استخدام الترجمة العكسية كأداة توثيق لإظهار “ما تقوله الترجمة” وبالتالي دعم اتخاذ القرارات من قبل الباحثين عند تعديل الأداة. إبستين وآخرون استنتجوا أن الترجمة العكسية لها تأثير ضئيل على المحتوى والخصائص النفسية لأداة متعددة الأبعاد. على الرغم من ذلك، حذر نفس المؤلفين من أن الترجمة العكسية هي نهج منهجي أساسي لمؤلفي أدوات القياس عندما لا يكون لديهم إتقان في “اللغة المستهدفة”.
تقدم الإرشادات والتوصيات المنشورة سابقًا مجموعة من النهج المنهجية بطريقة وصفية، التي لا تعزز اتخاذ القرارات من قبل الباحثين بشأن أفضل الخيارات لخصائص دراسات التحقق من الصحة الخاصة بهم. لتسهيل عملية اتخاذ القرار، اقترح العديد من المؤلفين مسارد، وأشجار القرار، وقوائم التحقق، التي تمكن الباحثين من تجنب الفجوات في العملية التي تؤثر على جودة الأداة النهائية، وتعزز الدور النشط للباحثين في إجراء العمليات. إن ندرة الدراسات التي تقارن بين النهج المنهجية تمنع التوصية بطريقة محددة، مما يعني أن عمليات الترجمة والتكيف والتحقق من الصحة عبر الثقافات تعتمد على المهارات والمعرفة والوقت، وهو شيء قد لا يمتلكه الباحثون الشباب دائمًا. بينا وعرفات أوصوا بتطوير إرشادات لدعم قرارات الباحثين طوال العملية. وبالمثل، دعا كروتشينيو وآخرون إلى إرشادات شاملة حول النهج المنهجية لاتخاذ القرارات من قبل الباحثين المبتدئين. المعرفة الشاملة بالنهج المنهجية هي شرط أساسي لدراسات التحقق من الصحة عبر الثقافات لأدوات القياس.

مبررات البحث والأهداف

ظهرت أولى الإرشادات المنتجة لمجال الرعاية الصحية من مراجعات أدبية شاملة، بما في ذلك الأدبيات من الصحة وعلم النفس وعلم الاجتماع. في البرازيل، كشفت مراجعة تكاملية للأدبيات التمريضية عن تركيز مفرط على تقييم الخصائص النفسية على حساب استكشاف النهج المنهجية للترجمة والتكيف عبر الثقافات. حتى الآن، لم تحدد أي دراسة الفروق والتشابهات بين الإرشادات الموجودة في الرعاية الصحية لدعم الباحثين الشباب في تطوير دراسات التحقق من الصحة. بناءً على ذلك، صغنا سؤال المراجعة التالي: – ما هي أوجه التشابه والاختلاف الموجودة في النهج المنهجية الموصى بها من قبل الإرشادات الموجودة حول عملية الترجمة والتكيف والتحقق من الصحة عبر الثقافات لأدوات القياس في علوم الرعاية الصحية؟ لذلك، تهدف هذه الدراسة إلى: 1) تحديد جميع الإرشادات والتوصيات للترجمة والتكيف عبر الثقافات والتحقق من الصحة ضمن علوم الرعاية الصحية؛ 2) وصف النهج المنهجية التي تم وضعها في هذه الإرشادات، و 3) تقديم إرشادات عملية تتضمن خيارات منهجية متنوعة للباحثين المبتدئين المشاركين في ترجمة وتكييف والتحقق من صحة أدوات القياس. إذا كنت تخطط لترجمة أو تكييف أداة قياس، ستساعدك هذه المقالة في اختيار نهج منهجي بشكل نقدي للحصول على أداة صالحة وموثوقة وغير متحيزة.

المواد والأساليب

تحديد الإرشادات الموجودة

تم إجراء مراجعة منهجية لهذه الدراسة. المراجعة المنهجية هي نوع من مراجعة الأدبيات تركز على تلخيص حالة الفن في الممارسات المنهجية ضمن مجال معين. في هذه المراجعة المنهجية، كان التركيز على النهج المنهجية المستخدمة في الترجمة والتكيف والتحقق من الصحة عبر الثقافات لأدوات القياس الموصى بها من قبل الإرشادات في مجال علوم الرعاية الصحية. لاستخدام هذه المراجعة المنهجية، استخدمنا استراتيجية بحث من ثلاث مراحل. كان البحث الأولي محدودًا إلى قواعد بيانات “CINAHL مع النص الكامل” (عبر EBSCO) و”MEDLINE مع النص الكامل” وشمل تحليل الكلمات النصية في العناوين والملخصات والمصطلحات المفهرسة المستخدمة لوصف المخطوطات في كل من هذه القواعد. شمل البحث الثاني التعبير البولياني (((MM “تكييف الأداة”) أو “الترجمة عبر الثقافات” أو “التحقق من الصحة عبر الثقافات”) و(“التوصيات” أو “أفضل الممارسات”)) في “CINAHL مع النص الكامل” (عبر EBSCO)، و”التكيف عبر الثقافات”[العنوان] أو “الترجمة عبر الثقافات”[العنوان] أو “التحقق من الصحة عبر الثقافات”[العنوان]) و(“التوصية*”[العنوان/الملخص] أو “أفضل ممارسة*”[العنوان/الملخص] أو “النهج المنهجي*”[العنوان/الملخص])) في “MEDLINE مع النص الكامل”. أخيرًا، قمنا بمراجعة قوائم المراجع للمخطوطات التي تم الحصول عليها لتحديد أي إرشادات لم يتم استردادها في البحث الأدبي الأولي في القواعد. استخدمنا هذه استراتيجية البحث لأنها سمحت لنا بتحديد إرشادات إضافية. تم إجراء البحث في قاعدة البيانات بين سبتمبر وأكتوبر 2023 وتم تكراره في فبراير 2024 لالتقاط أي إرشادات تم نشرها لاحقًا. لاختيار المقالات، كانت معاييرنا تستند إلى المفهوم الذي ينص على أن الإرشادات تلخص الأدلة وآراء الخبراء، مع الأخذ في الاعتبار الموارد الموجودة وقابلية الإجراءات. كانت معايير الإدراج لاختيار المخطوطات هي: 1) مقالة علمية تركز على عملية الترجمة أو التكيف أو التحقق من الصحة عبر الثقافات لأدوات القياس؛ 2) وصف إرشادات يجب اتباعها في واحدة من هذه العمليات؛ 3) مكتوبة باللغة الإنجليزية أو الإسبانية أو البرتغالية؛ و 4) منشورة في مجلة علمية في مجال علوم الرعاية الصحية. لتعريف مجالات الرعاية الصحية، استخدمنا إطار تصنيف مقدمي الرعاية الصحية (ICHA-HP)، الذي يصف الفاعلين الذين يقدمون الرعاية الصحية (مثل الأطباء العامين والمتخصصين، الممرضات والقابلات، أخصائيي العلاج الطبيعي والمعالجين الفيزيائيين، أخصائيي العلاج المهني والنطق، أخصائيي السمع، أخصائيي صحة الأسنان، أخصائيي الصحة النفسية، إلخ). كانت معايير الاستبعاد للمخطوطات هي: 1) مقالات تحريرية، مراجعات أدبية، أطروحات، رسائل علمية، أو فصول كتب، أو مقالات علمية غير مركزة على عملية الترجمة أو التكيف أو التحقق من الصحة عبر الثقافات لأدوات القياس؛ 2) مقالات لا تصف أي إرشادات يجب اتباعها في واحدة من هذه العمليات؛ 3) إرشادات تم تضمينها بالفعل للتأهل؛ 4) مقالات مكتوبة بلغة غير تلك المحددة؛ و 5) مقالات منشورة في مجال غير علوم الرعاية الصحية (مثل الاقتصاد والإدارة، علوم التعليم وعلم الاجتماع). يوضح الشكل 1 نتائج البحث واختيار الدراسات.
الشكل I مخطط تدفق PRISMA لمراجعة الأدبيات. تم التكيف من صفحة MJ، مكينزي JE، بوسويت PM، وآخرون. بيان PRISMA 2020: إرشادات محدثة للإبلاغ عن المراجعات المنهجية. BMJ. 2021:n71. المشاع الإبداعي.

تحليل محتوى الإرشادات الموجودة

تم إجراء تحليل محتوى، شمل إجمالي 42 إرشادًا تم استردادها من البحث الأدبي. بناءً على ذلك، وضعنا هدفين: 1) تقديم نظرة عامة على مجموعة النهج المنهجية المدرجة في الإرشادات و 2) تحديد أوجه التشابه والاختلاف الموجودة من حيث النهج المنهجية الموصى بها. في الخطوة الأولى، تم إعادة صياغة جميع الاقتباسات ذات الصلة من الإرشادات التي تركز على النهج المنهجية، وتم تلخيصها وهيكلتها. بناءً على هذه الاقتباسات، تم تشكيل إعادة صياغة، وتم توليد فئات بشكل استقرائي. بعد ذلك، تمت مراجعة الفئات المولدة وتجميعها حسب أوجه التشابه والاختلاف في فئات موضوعية أوسع. أخيرًا، تم وصف إعادة الصياغة والفئات المستمدة من الإرشادات سرديًا.

اقتراح لإرشادات عملية

تطوير الإرشادات هو عملية متعددة التخصصات يجب أن تشمل جميع المجالات ذات الصلة من الخبرة ووجهات النظر. استنادًا إلى تجميع النهج المنهجية من الإرشادات الموجودة، قمنا بإعداد
إرشادات عملية مستندة إلى منظور شامل، مُعززة بمساهمات من خبراء في مجالات إدارة التمريض، والإحصاءات، واللغويات مع خبرة في ترجمة وتكييف أدوات قياس الصحة عبر الثقافات وفي إشراف الباحثين المبتدئين. توصياتنا مستندة إلى العناصر المشتركة التي تم تحديدها بين الإرشادات المستخرجة من المراجعة المنهجية، وتُكمل بخبرتنا المهنية الخاصة.

النتائج

راجعنا 42 إرشادًا حول عمليات الترجمة، والتكييف، والتحقق عبر الثقافات لأدوات القياس. الإرشادات المدرجة نُشرت بين عامي 1993-2021، وكان معظمها قد نُشر خلال العقدين الأولين من القرن (الشكل 2). كانت الدول الرئيسية للنشر هي المملكة المتحدة (7)، هولندا (7)، الولايات المتحدة (4)، كندا (4)، إسبانيا (4)، والبرازيل (2) (الشكل 3). سيتم تقديم النتائج باستخدام الفئات الموضوعية الأربعة التي تم تطويرها بسبب التحليل: المعلومات العامة، الترجمة عبر الثقافات، التكييف عبر الثقافات، والتحقق عبر الثقافات. هنا، بما يتماشى مع أهداف هذه المراجعة المنهجية، نقدم نظرة عامة على أوجه التشابه والاختلاف في المناهج المنهجية الموصى بها من قبل الإرشادات حول كل فئة موضوعية.

المعلومات العامة

توصي بعض الإرشادات بمرحلة أولية قبل ترجمة الأداة تُسمى التحضير. تشمل هذه المرحلة الحصول على إذن لاستخدام الأداة، دون توضيح ما إذا كان هذا الإذن مُعطى من قبل مؤلفي الأداة أو من قبل الناشر الذي يمتلك حقوق الطبع والنشر للمقالات. يقترح مؤلفون آخرون أنه يجب طلب الإذن من ناشر الأداة، المؤسسة التابعة، أو المؤلفين. بالإضافة إلى ذلك، يشير مؤلفون آخرون إلى أنه يجب الحصول على الإذن من مالك حقوق الملكية الفكرية للأداة.
تشمل المرحلة الأولية أيضًا اتخاذ قرار بشأن الأداة التي يجب تكييفها عبر الثقافات. توصي بعض الإرشادات بأن يستند هذا القرار إلى التحقق من عدم وجود نسخة من الأداة للسكان المستهدفين، فهم سياقهم، غرضها، خصائصها، أبعاد البناء، المعادلة المفاهيمية للبناء للسكان المستهدفين، ملاءمتها للسياق السريري المقصود، ملاءمة الخصائص النفسية، وجود نسخ أخرى مُعدلة عبر الثقافات، والجدوى. فيما يتعلق بالجدوى، يحدد بعض المؤلفين عوامل مثل وقت الإنجاز، تكلفة ومدة الأداة، ونوع وسهولة الإدارة. توصي إرشادات أخرى فقط بتحديد الأدلة على جودة الأداة المختارة.
الشكل 2 توزيع الإرشادات حسب السنوات.
الشكل 3 توزيع الإرشادات حسب الدول.
لدعم القرار بشأن الأداة التي يجب تكييفها، يوصي بعض المؤلفين بدراسة أهمية البناء في السكان المستهدفين، بالإضافة إلى إطارها المفاهيمي، أو معناها، والذي يمكن أن يتم من خلال مراجعة الأدبيات، مقابلة مفتوحة أو مجموعة تركيز، أو ملاحظة أعضاء من السكان المستهدفين. يؤكد مؤلفون آخرون على أهمية تحديد الباحثين في وقت مبكر الفروق الثقافية واللغوية بين “الثقافة المستهدفة” و”الثقافة المصدر”. لتسهيل عملية الترجمة والتكييف، يقترح بعض المؤلفين تطوير تعريف لبناء الأداة. توصي بعض الإرشادات بتزويد المترجمين بمعلومات حول بناء الأداة، التي يمكن أن تساعد المترجمين في حل الفروق الثقافية واللغوية بين “الثقافة المصدر” و”الثقافة المستهدفة”، مثل المقالات العلمية.
كما يتضمن مرحلة التحضير تصميم بروتوكول لعملية التكييف عبر الثقافات للأداة المختارة. توصي بعض المؤلفين بأن يقرر الباحثون أي طريقة يجب استخدامها: 1) نفس نهج التكييف اللغوي للأدوات المعدلة في بلد أو سكان آخرين بنفس اللغة؛ 2) النهج الشامل للترجمات المخصصة لمواقع متعددة في وقت واحد؛ أو 3) النهج المحدد للبلد لإصدارات الترجمة المختلفة التي تم تطويرها لكل مجموعة فرعية. يُقترح استخدام مناهج وإجراءات منهجية مجمعة تعظم المعادلة المفاهيمية بين النسخة المترجمة و”النسخة الأصلية” من قبل بعض المؤلفين، والتي قد تختلف وفقًا للخصائص الخاصة للدراسات والموارد المتاحة للباحثين. يشمل ذلك إنشاء فريق متعدد التخصصات يتكون من مترجمين وخبراء في مجال بناء الأداة.
تحدد بعض الإرشادات دور القيادة للباحثين داخل فريق المترجمين والخبراء، على سبيل المثال في مراجعة القرارات للتوفيق بين الترجمات وإنتاج ترجمة أكثر حرفية أو أكثر مفاهيمية. يمكن أن تتولى بعض الأدوار الخاصة من قبل الباحثين، مثل الميسرين المؤهلين للجنة الخبراء، منسقي الترجمة، أو المراجعين للتدقيق بعد الترجمة الأمامية، الترجمة العكسية، الاختبارات المبدئية، والنسخة النهائية من الأداة المعدلة. يدعو بعض المؤلفين أيضًا إلى تضمين أعضاء من السكان المستهدفين في الفريق عند مراجعة الفروق الثقافية لأداة التقييم، ومطوريها، في عملية الترجمة والتكييف عبر الثقافات، ودراسة خصائص قياس الأداة.
توصي العديد من الإرشادات بتوثيق عملية الترجمة، والتكييف عبر الثقافات، والتحقق في تقرير يصف جميع المناهج والإجراءات المنهجية المستخدمة، ونتائجها، والمشكلات المحددة، والتعديلات المقترحة، بالإضافة إلى أسماء وأدوار وخلفيات جميع المعنيين، وعملية الاختبار، والتحليل الإحصائي. يوصي بعض المؤلفين بإنشاء نموذج لتسجيل مستمر للعملية. يمكن استخدام المعلومات في هذا النموذج لإثبات المعادلة بين النسخ المعدلة والأصلية
للأداة وكمواد تكميلية في نشر مقال علمي يصف عملية التكييف عبر الثقافات لأداة القياس. يؤكد مكينا، على أنه يجب الإبلاغ عن العملية العامة.

الترجمة عبر الثقافات

توصى بعض الإرشادات بالترجمة الأمامية والترجمة العكسية اللاحقة. يقترح بعض المؤلفين الترجمة الأمامية دون الترجمة العكسية، أو يقترحون الترجمة العكسية كخيار. الغالبية، تقترح أيضًا أن يتم إجراء الترجمة الأمامية والترجمة العكسية بشكل مستقل. على الرغم من ذلك، يقترح بعض المؤلفين استخدام مناهج تعاونية للترجمة، مثل نهج اللجنة أو مجموعة التركيز، اللوحة المزدوجة، استخدام لجنة ثنائية اللغة، الترجمة مع فرق من مترجمين اثنين، أو من مترجمين من اثنين إلى أربعة. توصي مؤلفون آخرون باستخدام الترجمة من جانب واحد أو ترجمة الخبراء من قبل لجنة عندما لا تسمح الموارد البشرية أو المالية بالتخطيط للترجمة العكسية.
فيما يتعلق بعدد المترجمين، تقترح معظم الإرشادات استخدام مترجمين اثنين على الأقل لترجمة الأداة ونفس العدد للترجمة العكسية، أو مترجمين اثنين لكل من هذين النهجين. يقترح آخرون مترجمين اثنين على الأقل للترجمة الأمامية ومترجم واحد على الأقل للترجمة العكسية، وآخرون، مترجم واحد مختلف على الأقل للترجمة الأمامية والترجمة العكسية. توصي مؤلفون آخرون بثلاثة مترجمين للترجمة الأمامية ومترجم واحد للترجمة العكسية. بعض الإرشادات التي لا توصي بالترجمة العكسية توصي باستخدام مترجم واحد، ومترجمين اثنين للترجمة الأمامية. توصي مؤلفون آخرون بترجمات متعددة دون تحديد عدد أدنى.
توصي بعض الإرشادات بأن يقدم الباحثون تعليمات للمترجمين حول أي نهج ترجمة يجب اتباعه (سواء كان أكثر حرفية أو أكثر ثقافية)، موضحين مفاهيم أداة القياس وكيفية استخدام تعريفاتها في كل من العناصر، والتي قد تتطلب توفير المواد مسبقًا. يُوصي الآخرون فقط بتقديم معلومات حول غرض الأداة، والسكان المستهدفين وهدف الترجمة إذا كانت الدراسة تشمل مترجمين محترفين. يوصي معظم المؤلفين باستخدام مترجمين ناطقين باللغة الأم، الذين يجيدون اللغتين المصدر والهدف. يقترح مؤلفون آخرون أن تشمل عملية الترجمة على الأقل مترجم محترف مختلف واحد في كل من أساليب الترجمة الأمامية والترجمة العكسية، بينما يحدد آخرون فقط تضمين المترجمين المحترفين في كلا الأسلوبين، وآخرون فقط للترجمة العكسية.
فيما يتعلق بالمترجمين المشاركين في الترجمة الأمامية، يتم وصف خصائص متنوعة، على سبيل المثال: 1) الإلمام بمفهوم الأداة؛ ) أن يكون محترفًا صحيًا على دراية بالمصطلحات المستخدمة في أداة القياس، أو لديه خبرة في الحالة السريرية المعنية؛ ) أن يكون لديه خبرة في الترجمة؛ 4) أن يكون لديه خبرة سابقة في PROMs، و5) أن يكون عضوًا ممثلًا عن السكان المستهدفين. يتطلب بعض المؤلفين وجود مترجم على دراية بمفهوم الأداة ومترجم غير مألوف، بينما يتطلب آخرون وجود مترجمين اثنين على دراية بالأداة والسياق. يوصى أيضًا بأن المترجمين المشاركين في الترجمة العكسية: 1) لا يكون لديهم وصول إلى “الأداة الأصلية”، 2) أن يكونوا غير مدركين للمفهوم المراد قياسه، أو أن يكون أحدهم على دراية بمجال مفهوم الأداة والآخر على دراية بالفروق اللغوية والثقافية لـ”اللغة المصدر”.
تحدد معظم الإرشادات مرحلة التوليف أو المصالحة بعد الترجمة الأمامية لتحديد وحل التناقضات في الترجمة. للقيام بذلك، أوصى بعض المؤلفين باستخدام مترجم ثالث لمصالحة النسختين من الترجمة الأمامية، أو مراجع واحد، أو اثنان. للحصول على ترجمات أكثر دقة، يمكن للباحثين أيضًا تقديم مواد لمترجمي المصالحة. تحدد بعض الإرشادات أن المراجع يجب أن يصالح بين الترجمتيْن في نسخة واحدة مع المترجمين المشاركين، بما في ذلك عناصر من السكان المستهدفين. لمناقشة والوصول إلى توافق حول الاختلافات الموجودة بين نسخ الترجمة الأمامية، يمكن استخدام نهج اللجنة، مجموعة التركيز، أو لجنة دلفي. إذا لم يكن من الممكن الوصول إلى توافق بشأن بعض التناقضات، قد يتم إشراك أحد مطوري “الأداة الأصلية”، أو استخدام مترجم مستقل، يقرر بشأن الترجمة بمفرده مع مدخلات من مطوري أداة القياس أو مترجم أمامي آخر. يوصي آخرون باستخدام لجنة دلفي لتقييم وحل التناقضات بين
المفاهيم مع عناصر غير متضمنة في الترجمات السابقة ولكن مع معرفة واسعة بالمفاهيم المراد قياسها. كبديل لاستخدام نهج تعاوني، يقترح بعض المؤلفين أن تتم مراجعة النسخة المترجمة عكسيًا بواسطة مترجم مستقل يقرر بشأن المعادلة الدلالية من خلال المقارنة مع “النسخة الأصلية” لأداة القياس. يقترح مؤلفون آخرون أن يتم دمج نسخ الترجمة الأمامية والعكسية بواسطة نفس المترجم المستقل.
فيما يتعلق بتحديد الاختلافات الموجودة، يجادل بعض المؤلفين بأن معنى مصطلح أصلي يمكن أن يتغير خلال عملية الترجمة إذا كان جزء فقط من المعنى موجودًا في “الثقافة المستهدفة” أو إذا كانت المصطلحات في “الثقافة المستهدفة” توسع معنى المصطلح في “الثقافة المصدر”. يحدد بعض المؤلفين معايير بناءً على المصدر وقابلية الفهم، والملاءمة الثقافية، والقواعد والمصطلحات لدعم قرار عملية المصالحة.

التكيف عبر الثقافات

لتكييف الأدوات عبر الثقافات، تتضمن عدة إرشادات استخدام نهج تعاوني في شكل لجان خبراء. بالنسبة لبعض المؤلفين، تهدف لجنة الخبراء إلى ضمان المعادلة الدلالية فقط، بينما تهدف بالنسبة للآخرين أيضًا إلى ضمان المعادلة الاصطلاحية، والمعادلة التجريبية، والمعادلة المفاهيمية. يسمي المؤلفون الذين لديهم هدف أضيق اللجنة بلجنة ثنائية اللغة، بينما يسمي المؤلفون الذين لديهم هدف أوسع الإجراء الذي تقوم به لجنة الخبراء بإجراء التوافق، واللجنة، لجنة المراجعة، أو اللجنة متعددة التخصصات. تشمل الأخيرة مترجمين، ولغويين، ومنهجيين، وعلماء نفس قياس. قد تشمل أيضًا عنصرًا أحادي اللغة. يتضمن بعض المؤلفين أيضًا أعضاء من السكان المستهدفين، الذين يفضل أن يكونوا مستقلين عن فريق المشروع، والذين يمكن أن يكونوا محترفين صحيين. يشجع مؤلفون آخرون على عقد اجتماع مع خبراء من السكان المستهدفين بعد لجنة الخبراء. يمكن أن يشارك مطور أداة القياس أيضًا إذا كان متمكنًا في “اللغة المستهدفة” أو يمكن الاتصال به لتوضيح أي مسائل. في تسمية لجنة الخبراء، اعتمد بعض المؤلفين مصطلح “المحترفين” بدلاً من “الخبراء” لأنهم يعتبرون أنه، فيما يتعلق بـ PROMs، هؤلاء الأفراد هم الخبراء الرئيسيون.
يُوصى بالتواصل مع مطوري “الأدوات الأصلية” من قبل بعض المؤلفين، خصوصًا عندما يرغب الباحثون في حذف عناصر قبل التحليل النفسي، أو عند تحديد الحذف في أداة القياس. فيما يتعلق بتكييف العناصر، يدعو بعض المؤلفين إلى أنه يمكن تكييف العناصر للحفاظ على معناها عندما: 1) لا يكون الترجمة الحرفية إلى “اللغة المستهدفة” ممكنة بسبب نقص الكلمات أو 2) تتضمن العناصر في “اللغة المصدر” تعبيرات اصطلاحية. يتطلب موافقة مطوري الأداة كلما كانت هناك حاجة لاستبدال أجزاء من العناصر، أو عناصر كاملة. يوصي بعض المؤلفين بتجنب تضمين عناصر جديدة وإزالة أجزاء من العناصر أو عناصر كاملة قبل التحقق النفسي. يعتبر آخرون إمكانية حذف العناصر، طالما كانت عناصر ذات صلة ثقافية منخفضة. توصى تقنيات التمركز أو التركيز المزدوج لتكييف العناصر.
تتضمن معظم الإرشادات اختبارات مسبقة لتكييف أدوات القياس عبر الثقافات. 112،114،116-119،122-124،126-130،133 بالنسبة لبعض المؤلفين، تتضمن الاختبارات المسبقة إجراء تفريغ معرفي مع أعضاء من السكان المستهدفين، باستخدام مجموعة التركيز أو لجنة دلفي، لتقييم تفسير العناصر في النسخة المتوافقة وتحديد الصياغة التي قد تكون غير واضحة. تتكون مقابلات التفريغ المعرفي من: 1) طلب من المشاركين الإجابة على الاستبيان؛ ) إعادة صياغة فهم المشاركين، عنصرًا تلو الآخر، لتحديد العناصر التي قد تواجه مشاكل في الترجمة؛ ) السؤال عما إذا كانوا سيكتبون العناصر بشكل مختلف، وكيف اختاروا إجاباتهم، إذا حددوا أي كلمات لم يفهموها وإذا اعتبروا أي تعبيرات غير مقبولة أو مسيئة، و4) السؤال عن المواضيع ذات الصلة التي يمكن تضمينها في الاستبيان. لا يوجد توافق على عدد المشاركين في تفريغ المجموعة، والذي يمكن أن يتضمن بين ثلاثة وعشرة مشاركين، خمسة إلى ثمانية عناصر، على الأقل ثمانية، على الأقل عشرة عناصر، أو مع عشرة إلى خمسة عشر مشاركًا من السكان المستهدفين. يجب أن يكون المستجيبون ممثلين للسكان المستهدفين (على سبيل المثال من حيث الجنس، والعمر، والتعليم، والتشخيص). يوصي مؤلفون آخرون بإمكانية تسجيل هذا التفريغ بالفيديو أو الشريط. تحدد عدة إرشادات تفريغًا معرفيًا مع مقابلات فردية وجهًا لوجه تُجرى مع أعضاء من السكان المستهدفين، ويفضل أن تكون مسجلة. أيضًا، لا يوجد توافق على التفريغات الفردية أيضًا، والتي يمكن أن تشمل خمسة إلى ثمانية مستجيبين، على الأقل سبعة مرضى أو سبعة محترفين صحيين يمثلون السكان المستهدفين، عينة من 30 عنصرًا، إلى 40 مشاركًا، و25 إلى 75 مستجيبًا. توصي بعض الإرشادات بجمع معلومات سكانية ديموغرافية
من المشاركين في الاختبار المسبق، وتسجيل وتفريغ المقابلات المعرفية، وآخرون بتشفير المقابلات من قبل باحثين مستقلين.
الخصائص الخاصة بأدوات القياس التي يجب اختبارها والتي أوصى بها المؤلفون متنوعة. تم تضمين اختبار مسبق للوضوح في عدة إرشادات، بالإضافة إلى اختبار مسبق للشمولية، والقبول، وملاءمة العناصر، وتأثير العناصر العاطفي. بعض المؤلفين يوصون بتقييم الشمولية والملاءمة بشكل منفصل، يتبعها مقابلة معرفية لتقييم الوضوح. مؤلفون آخرون يقترحون تقييم التماسك والشمولية للعناصر، والجوانب التشغيلية، بالإضافة إلى الملاءمة والوضوح. آخرون يقترحون تقييم الوضوح والشمولية والقبول. فيما يتعلق بمقاييس النتائج الذاتية، يُقترح إجراء اختبارات مسبقة مع المرضى لتقييم الملاءمة، والشمولية، والوضوح، ومع المهنيين الصحيين لتقييم الملاءمة فقط، والشمولية. بعض المؤلفين يتضمنون في اختبار الشمولية، تقييم الوقت اللازم لإكمال الأداة، من قبل المشاركين أو الباحثين. قبل إجراء الاختبارات المسبقة، قد يتم تضمين مراجعة نقدية للأداة المعدلة من قبل أعضاء من السكان المستهدفين.
في الاختبارات المسبقة التي تقيم الوضوح، والملاءمة، والشمولية، والتماسك والجوانب التشغيلية، يُقترح استخدام مقياس بصري متدرج أو مقياس من نوع ليكرت لتقييم صلاحية المحتوى للأداة المعدلة. لتقييم هذا النوع من الصلاحية، يُوصى بحساب مؤشر صلاحية المحتوى (CV-I) لأداة القياس وCV-I لكل عنصر، ومعامل كابا للاتفاق. العناصر ذات القيم غير المقبولة يتم مراجعتها وإعادة تقييمها. بعض المؤلفين يذكرون أنه بالتزامن مع تقييم صلاحية المحتوى، يمكن أيضًا إجراء تحليل إحصائي (مثل، تحليل عناصر راش وكرونباخ’s ). يُوصى من قبل بعض المؤلفين بالحفاظ على الأداة المعدلة بنفس تنسيق العناصر وخيارات الاستجابة كما في “الأداة الأصلية”. مؤلفون آخرون يوصون بأن يناقش فريق البحث التنسيق، والتعليمات، وطريقة الإدارة وطرق القياس المستخدمة من قبل “الأداة الأصلية” مع أعضاء من السكان المستهدفين. بعد الاختبار المسبق، يحدد بعض المؤلفين الحاجة إلى اتخاذ قرار بشأن شكل نشر الأداة (سواء من خلال استبيان ورقي أو استبيان إلكتروني).

التحقق عبر الثقافات

العديد من الإرشادات لا تتضمن التحقق السيكومتري كخطوة في عملية التكيف عبر الثقافات. آخرون يتضمنون فقط التحقق السيكومتري دون تغطية مراحل الترجمة والتكيف عبر الثقافات. آخرون يقدمون معلومات عن الخصائص السيكومترية التي يجب تقييمها، وآخرون يوضحون معلومات عن الإجراءات الإحصائية وطرق التحليل لتقييم خصائص معينة.
فيما يتعلق بالإجراءات والطرق الإحصائية، يتضمن بعض المؤلفين معلومات عن متطلبات العينة للتحقق السيكومتري، وهي أن عدد المشاركين يجب أن يؤخذ في الاعتبار بناءً على عدد القيم المفقودة، قوة الاختبار الإحصائي، أو أن التشبع أكثر أهمية من حجم العينة. آخرون يقترحون بشكل محدد الحصول على > 100 مشارك كمعيار جيد جدًا لتقييم الاتساق الداخلي، وقياس الخطأ والموثوقية، واختبار الفرضيات لصلاحية البناء ومقارنة المجموعات الفرعية. مؤلفون آخرون يقترحون حجم عينة من 100 و200 مستجيب، وآخر على الأقل 200 مشارك. آخرون يشيرون إلى نسبة 10 مشاركين لكل عنصر في الأداة. يُوصى باستخدام العينة الملائمة لاختيار العينة، مع خصائص ذات صلة بالاستخدام المقصود للأداة.
فيما يتعلق بالخصائص السيكومترية، وجدنا مجموعة واسعة من المعلومات. بعض المؤلفين يقترحون تقييم الموثوقية، بينما يحدد آخرون تقييم كرونباخ’s معامل الارتباط بين الفئات (ICC)، أو مؤشر K، كمؤشر على موثوقية الاختبار وإعادة الاختبار. لتقييم هذه الخاصية، يُوصى بتطبيق نفس الأداة المعدلة على نفس المستجيبين بعد سبعة وأربعة عشر يومًا. لتقييم الاتساق الداخلي، يوصي العديد من المؤلفين باستخدام تحليل العوامل الاستكشافية (EFA) يتبعه تحليل العوامل التأكيدي (CFA)، أو نمذجة المعادلات الهيكلية الاستكشافية كبديل لتحليل العوامل التأكيدي. آخرون يتضمنون أيضًا ارتباط العنصر الكلي، والارتباط بين العناصر ووظيفة العنصر التفاضلية (DIF). الغرض من تقييم DIF هو مقارنة مستوى عنصر بين مجموعتين مختلفتين من مستويات مختلفة باستخدام نفس الأداة أو تحديد العناصر التي قد تسبب انحياز القياس. لتقييم الصلاحية عبر الثقافات، يُوصى أيضًا بـ EFA يتبعه CFA. فيما يتعلق بصلاحية الأداة، بعض
المؤلفين يشيرون بشكل عام إلى تقييمها. آخرون يحددون قياس صلاحية المحتوى، وصلاحية البناء، خصوصًا من خلال تحليل الهيكل العاملي للأداة (البعدية). صلاحية المعايير هي خاصية موصى بها أخرى، خصوصًا صلاحية التمييز، صلاحية التنبؤ، صلاحية التقارب، وصلاحية التزامن. بعض المؤلفين يذكرون أنه يمكن التحقق من صلاحية اثنين أو أكثر من الأدوات بشكل متزامن، خاصة عندما تكون هناك علاقات معروفة بين بنائها. أخيرًا، يقترح مؤلفون آخرون تقييم خطأ القياس، الاستجابة، تأثيرات الأرض والسقف، واختبار الفرضيات.
استنادًا إلى الخصائص السيكومترية، يقترح بعض المؤلفين تقييم جودة الأدلة لكل خاصية قياس، وهي صلاحية المحتوى (مع أدلة على أن عناصر الأداة ذات صلة، وواضحة وقابلة للفهم فيما يتعلق بالبناء المعني والسكان المدروسين)، صلاحية الهيكل (مع أدلة على تحليل العوامل أو نظرية استجابة العنصر (IRT)/تحليل راش)، الاتساق الداخلي (كرونباخ’s )، الصلاحية عبر الثقافات/ثبات القياس مع أدلة من DIF أو تحليل العوامل التأكيدي متعدد المجموعات، والخصائص القياسية المتبقية (الموثوقية، خطأ القياس، صلاحية المعايير، اختبار الفرضيات لصلاحية البناء والاستجابة). استنادًا إلى هذه الأدلة، يقترح بعض المؤلفين أن يقيم الباحثون درجة التكافؤ العنصري واللغوي، التكافؤ التشغيلي، التكافؤ الوظيفي والتكافؤ المفهومي وتكافؤ القياس. على سبيل المثال، إذا كشف تحليل العوامل عن اختلافات هيكلية بين الثقافات، يُنصح بالافتراض أن الأداة ليست متكافئة بين الثقافات. في مثل هذه الحالات، يُوصى باللجوء إلى طرق البحث النوعي لفهم الأسباب وراء هذا النقص في التكافؤ. بالإضافة إلى ذلك، يوصي بعض المؤلفين بمقارنة الخصائص السيكومترية التي تم الحصول عليها بتلك التي أبلغ عنها مؤلفو “الأداة الأصلية”، ومراجعة ملاءمة الخصائص السيكومترية مع الفريق، وكذلك مع الخبراء في مجال بناء الأداة وأعضاء من السكان المستهدفين.

النقاش

يساعد استخدام نهج منهجي صارم في تقليل حدوث التحيزات خلال عملية الترجمة، والتكيف، والتحقق عبر الثقافات لأدوات القياس. على الرغم من وجود ثروة من الإرشادات في الأدبيات حاليًا، غالبًا ما يركز الباحثون فقط على جوانب الترجمة ولا يستخدمونها كدليل منهجي في دراساتهم. تم نشر بعض هذه المعلومات كمعايير من قبل بعض المنظمات العلمية. على سبيل المثال، قامت اللجنة الدولية للاختبارات بنشر، بعدة لغات، معايير تتعلق بقرار تعديل أداة قياس، وعملية الترجمة والتكيف، وعملية التحقق التجريبي، والتسجيل والتفسير وتوثيق الإجراءات المستخدمة. بالإضافة إلى ذلك، في الولايات المتحدة، وضعت الجمعية الأمريكية للبحوث التعليمية مجموعة من المعايير لتقييم الصلاحية والموثوقية التي تشمل خصائص تصميم وتطوير أدوات القياس. لقد نشر العديد من الباحثين عبر مجالات مختلفة نماذج وإرشادات وتوصيات مفصلة لعمليات الترجمة والتكيف والتحقق الثقافي المتبادل. تختلف هذه الإرشادات من حيث المتطلبات المسبقة، وعدد المراحل، وعدد وملفات المترجمين المشاركين، وتكوين لجنة الخبراء وملفاتهم، ووجود مراجعين للترجمات، وطرق تحديد التحيز، وعدد وطرق إجراء الاختبارات المبدئية. في بعض المجالات العلمية، قد يكون هناك تفضيل لاستخدام نهج منهجي واحد. ومع ذلك، ليس من الضروري اتباع جميع خطوات وإجراءات الإرشادات في التحقق من صحة الأداة، حيث قد لا تكون الإرشادات قابلة للتطبيق على جميع خصائص الدراسات. حتى عندما يختار الباحثون اتباع إرشادات معينة لتطوير العملية، فإن ذلك لا يمنع إمكانية تخصيص النهج المنهجي الموصى به في كل مرحلة. يمكن تبرير هذا التخصيص بناءً على أنواع المعادلة التي يجب تحقيقها أو تعزيزها وعلى التحيزات التي يجب تجنبها.

توثيق العملية

يمكن أن يؤدي تحديد أسباب الاختلاف في عمل نسخة معدلة أو موثقة من أداة قياس معينة إلى أن يأخذ الباحثون في الاعتبار إمكانية التحيز أثناء عملية الترجمة والتكيف والتحقق الثقافي المتبادل. للتحقق من هذه الإمكانية، يحتاج الباحثون إلى التأكد من أن العملية قابلة للتتبع مع سجلات في كل مرحلة. تسمح هذه السجلات، على سبيل المثال، للباحثين بالتحقق من أن انخفاض أهمية عنصر معين لا يرتبط بأي نوع من التحيز وقد يتم، نتيجة لذلك، تعديله أو استبعاده قبل التحقق النفسي من أداة القياس. في كل مرحلة، يحتاج الباحثون المشاركون في عملية تعديل أدوات القياس إلى تقديم دليل رسمي
كتابي على الأهمية المحتملة للأدوات للمشاركين من “الثقافة المستهدفة”، فضلاً عن المعادلة التشغيلية للأداة. قد يكون توثيق القرارات تجريبيًا ولكن معظمها سيكون نظريًا بطبيعته. يتضمن هذا التوثيق، على سبيل المثال، معلومات حول المراحل المختلفة للعملية والأنشطة التي تم تنفيذها في كل منها. يجب أن يتضمن أيضًا معلومات حول القرارات، والأسس، والتفكير وراء تلك القرارات، فضلاً عن المحترفين الذين شاركوا في الأنشطة المختلفة. يعد توثيق التعديل الجزئي أو إزالة العناصر واحدة من المشاكل الرئيسية في التكيف الثقافي لأدوات القياس ويتطلب تبريرًا مناسبًا. يجب أن تمكن هذه المعلومات الباحثين الآخرين من فهم وتقييم العمل المنجز، وتكرار الإجراءات المستخدمة سواء في نفس السكان أو في آخرين. تعد قابلية النقل مفهومًا رئيسيًا عندما يتم استخدام أداة قياس معينة في ثقافات وسياقات مختلفة. تدعم الاعتبارات المتعلقة بقابلية نقل أداة القياس بالتوثيق حول أهمية البناء، وطريقة القياس المستخدمة، واستراتيجيات الترجمة المعتمدة، والممارسات الثقافية التي قد تؤثر على النتائج. كراتشينيو وآخرون قدموا النسخ المختلفة من عملية التكيف الثقافي في مواد إضافية مع نشر عملية الترجمة والتكيف الثقافي لاستبيان BHAB. بعد كتابة بروتوكول دراستك، تأكد من إنشاء نموذج توثيق تسجل فيه جميع الخطوات وجميع النهج المنهجية التي سيتم استخدامها ونتائجها.

مراحل العملية

يفصل إجراء الاختبار الميداني لأداة القياس إجراءات الترجمة والتكيف والتحقق الثقافي المتبادل عن إجراءات التقييم النفسي التي تحدد التحليل العالمي لخصائصها. بناءً على ذلك، نظمنا العملية العامة في ثماني خطوات متسلسلة بأغراض متميزة، وهي: 1) الترجمة الأمامية؛ 2) تجميع الترجمة الأمامية؛ 3) الترجمة العكسية؛ 4) التوافق؛ 5) الاختبار المبدئي؛ 6) الاختبار الميداني؛ 7) التحقق النفسي و 8) تحليل الخصائص النفسية (الشكل 4). بعد ذلك، سنصف كل واحدة من هذه الخطوات.

الترجمة الأمامية

لا تكون الترجمة من لغة إلى أخرى دائمًا مباشرة بسبب تنوع الاحتمالات لترجمة كلمة أو تعبير، ولأنه قد لا يكون هناك كلمة مكافئة في “اللغة المستهدفة” لتمثيل مصطلح معين. نتيجة لذلك، قد يختار مترجمون مختلفون خيارات ترجمة مختلفة لنفس الأداة التي لا تتطابق. لتحقيق ترجمة واضحة، أنتج بريسلين ولونر وثورندايك، مجموعة من 12 إرشادًا. تحدد هذه التوصيات الحاجة إلى أن تتضمن العناصر: 1) جمل قصيرة وواضحة ومبسطة؛ 2) استخدام الصوت النشط بدلاً من الصوت المبني للمجهول؛ 3) استخدام الأسماء بشكل متكرر بدلاً من الضمائر؛ 4) تجنب استخدام الاستعارات أو العبارات الإقليمية أو التعابير الاصطلاحية أو العامية؛ 5) عدم استخدام صيغة الفعل الموصولة؛ 6) استخدام عبارات إضافية لضمان فهم محتوى العنصر؛ 7) عدم استخدام عناصر تتضمن ظروفًا وحروف جر؛ 8) تجنب محتوى العنصر الذي يتضمن أشكال الملكية للكلمات؛ 9) أن تكون محددة؛ 10) عدم استخدام أوصاف غامضة؛ 11) إلمام المترجم بمحتوى العنصر، و 12) تجنب أكثر من فعل واحد لمحتوى العنصر الذي يقترح إجراءات مختلفة. يجعل الاهتمام بوضوح العناصر من الممكن ضمان المعادلة المفاهيمية بين النسخ المستهدفة والمصدر. بالنسبة لهذه الإجراءات، تقترح معظم النهج المنهجية الحد الأدنى من مترجمين مختلفين. بغض النظر عن عدد المترجمين، من الضروري أن تتم الترجمات بشكل مستقل، وأن لا يناقش المترجمون الترجمة قبل إكمالها، وأن لا يتأثر عملهم بمعرفتهم أن الترجمة ستخضع للترجمة العكسية. يجادل أوزولينز، أنه إذا كان المترجمون الأماميون على علم بأن وثيقة ستخضع للترجمة العكسية، أحيانًا يمكنهم اختيار مصطلحات أكثر حرفية بدلاً من اختيار مصطلحات مناسبة ثقافيًا في “اللغة المستهدفة.”
يسمح استخدام مترجمين محترفين يعملون في زوج اللغات المعني بإجراء مقارنات بين نسخ أداة القياس في كلا اللغتين، مما يسهل تحديد الغموض والاختلافات، حتى عندما يكون هناك معادلة دلالية. واحدة من المتطلبات الرئيسية هي الإلمام بكلا الثقافتين للتعرف على المواقف والعناصر التي قد تكون الترجمة الحرفية غير كافية. يجب على المترجمين الأماميين أيضًا تقديم اقتراحات لعناصر في الثقافة التي سيتم تعديل الأداة فيها، حتى لو ترك العنصر بمعنى مختلف عن الأصل. على سبيل المثال، يمكن للمترجمين اقتراح استبدال مصطلحي “مساعدي التمريض” و”الممرضات الممارسات المتقدمات”، على التوالي، بـ”الطاقم المساعد” و”الممرضات المتخصصات”، في البلدان التي لا توجد فيها هذه الفئات. بالإضافة إلى كونهم ثنائيي الثقافة، توصي بعض النهج المنهجية باستخدام مترجمين محترفين فقط. تعرف أخرى على تضمين المترجمين الذين هم ناطقون أصليون بـ”اللغة المستهدفة”، ولديهم ملف تعريف محدد، على سبيل المثال، أن يكونوا على دراية بـ
الشكل 4 مخطط تدفق عملية الترجمة والتكيف والتحقق الثقافي المتبادل.
بناءً على بناء الأداة. لتقليل خطر التحيز في المحتوى، يمكن أن يشارك أعضاء من السكان المستهدفين الذين يُقصد تطبيق أداة القياس عليهم في الترجمة. إذا لم يكن بالإمكان إشراك أعضاء من السكان المستهدفين، يمكن اختيار أعضاء على دراية بالمصطلحات المستخدمة في أداة القياس. وفقًا لهيدريك، ترجمة أدوات القياس لا تهدف إلى الحصول على ترجمة دقيقة بل تهدف إلى الحصول على نسخة معدلة تعادل “النسخة الأصلية”. من المثالي أن يكون هناك دائماً مترجمان، أحدهما بدون ملف تعريف محدد يركز على المعادلة الدلالية (يفضل أن يكون مترجماً محترفاً)، والآخر لديه خبرة في مجال محتوى بناء الأداة لضمان المعادلة المفهومية. المترجمون الذين ليسوا على دراية ببناء الأداة، يمكنهم بسهولة تحديد المعاني الغامضة في الأدوات الأصلية. أثناء ترجمة الأدوات، يسجل كلا المترجمين شكوكهم وتعليقاتهم في نموذج يقدمه الباحثون. قبل الترجمة، يجب إعطاء تعليمات للمترجمين حول نوع الترجمة المقصودة، سواء كانت أكثر حرفية أو أكثر ثقافية. إذا لزم الأمر، يجب أيضاً توفير مواد باللغة “الهدف” تسهل فهم بناء أداة القياس.

ترجمة أمامية تركيبية

في معظم الإرشادات الخاصة بالترجمة، التكيف والتحقق من صحة الأدوات عبر الثقافات، يتم التعبير عن الترجمة المستقلة بالتعاون القائم على الفريق للوصول إلى توافق بين المترجمين المعنيين. الطريقة المعتمدة في هذه المرحلة لتركيب الترجمتيْن في نسخة واحدة تُسمى نهج اللجنة. يتكون هذا النهج من اجتماع مع المترجمين الذين شاركوا في الخطوة السابقة لمناقشة اختلافات الترجمة والوصول إلى توافق حول الترجمة الأكثر ملاءمة لكل عنصر. يتيح نهج اللجنة اكتشاف الخصائص اللغوية والثقافية المحددة من المراحل الأولى من التكيف عبر الثقافات لأدوات القياس. بعض المؤلفين يدعون أن يتم تنسيق نهج اللجنة بواسطة مترجم ثالث متمكن في كلا اللغتين وبدون ملف تعريف محدد. يمكن أن يسهل هذا العنصر المنسق مناقشات وعمليات التوافق بين المترجمين الأماميين. لهذا الغرض، قبل أن يتم الاجتماع، يقدم الباحثون لهم جدولاً مقارناً مع كلا الترجمتيْن ومع الشكوك والتعليقات التي أصدرها كل مترجم. كما يطلبون من المترجم الثالث تقديم اقتراح ترجمة بناءً على الغموض والاختلافات المكتشفة في كل عنصر ليتم تقديمه ومناقشته في اجتماع اللجنة. خلال الاجتماع، يقوم أحد الباحثين بتيسير المناقشات وتوثيق القرارات المتخذة. إذا لم يكن من الممكن إشراك مترجم ثالث، يتم تقديم اقتراح الترجمة بواسطة باحث. يجب أن يصف تقرير هذه المرحلة الحلول التوافقية لحل الغموض والاختلافات الموجودة. يجب مراجعة هذا التقرير من قبل فريق البحث. إذا لزم الأمر، اتصل بمطوري أداة القياس لتوضيح أي شكوك محتملة عند ترجمة العناصر.

الترجمة العكسية

الترجمة العكسية هي عملية ضمان جودة للتحقق من دقة الترجمة الأمامية، وتجعل من الممكن نظرياً توسيع الصياغات غير الواضحة و”التناقضات الجسيمة/الأخطاء المفهومية”، التي تحتاج إلى توضيح. تشمل ترجمة الأداة من “اللغة المستهدفة” (الترجمة الأمامية) إلى “اللغة الأصلية”، مما ينتج عنه ترجمة عكسية. من المتوقع أن يقدم المترجمون العكسيون ترجمة تكون “حرفية أو وفية قدر الإمكان، مع احترام قواعد “اللغة المستهدفة”. كما يُطلب منهم تكرار أي أخطاء موجودة في الترجمة الأمامية وتدوين أي اختلافات أو لغة غير طبيعية. يتم توثيق هذه التعليقات بعد ذلك في نموذج يقدمه الباحثون. نظرًا لأن عملية الترجمة العكسية تختلف كثيرًا عن عملية الترجمة القياسية، من المهم أن يتم تدريب المترجمين على ما يتضمنه الترجمة العكسية. يجب أن يكون عدد وملف تعريف المترجمين العكسيين مطابقين لتلك الخاصة بالمترجمين الأماميين. توصي جميع الإرشادات تقريبًا بأن يكون المترجمون العكسيون على دراية بكلتا اللغتين وأن يكونوا ناطقين أصليين بلغة الترجمة العكسية (التي تكون دائمًا تقريبًا الإنجليزية). إذا لم يكن الناطقون الأصليون متاحين، يجب أن يكون هناك على الأقل مترجمان متمكنان في “اللغة المصدر” و”اللغة المستهدفة”. أكثر أهمية من تضمين المترجمين الناطقين الأصليين هو إجراء الترجمة العكسية بطريقة معتمة، أي يجب ألا يكون لدى المترجمين العكسيين وصول إلى أداة القياس الأصلية، ولا يتم إبلاغهم عن بنائها. تضمن هذه الخاصية المعادلة المفهومية، ومع ذلك، لا يتم وصفها دائمًا في الدراسات. من المهم بشكل خاص التأكد من أن جميع المترجمين العكسيين على دراية بهذا الشرط، حيث يتم تدريب المترجمين على فهم السياق قدر الإمكان لتقديم ترجمة دقيقة. مع الترجمة العكسية لأداة القياس، يتم إنتاج نسختين من الأداة باللغة
من الوثيقة الأصلية. بغض النظر عما إذا كانت هناك اختلافات طفيفة بين النسختين، فإن الجانب الرئيسي الذي يحتاج إلى التحليل في الخطوة التالية هو ما إذا كان هناك تغيير في المعنى بين العناصر في الترجمة العكسية والعناصر في “الأداة الأصلية”.

التناغم

مماثل لمرحلة تركيب الترجمة، بعد الحصول على النسخ المترجمة عكسيًا، يجب على الباحثين استخدام نهج قائم على الفريق. في هذه المرحلة، تتم مقارنة جميع نسخ أداة القياس (النسخة الأصلية، النسخة المترجمة والنسخة المترجمة عكسيًا) من قبل جميع المترجمين المعنيين من أجل تحديد أي غموض واختلافات محتملة، ولتقرير الترجمة الأكثر ملاءمة. يتكون النهج القائم على الفريق المستخدم في هذه المرحلة من لجنة متعددة التخصصات. يشار إلى هذا النهج أيضًا باسم لجنة الخبراء، أو اجتماع التناغم. تتكون اللجنة متعددة التخصصات من اجتماع يضم أعضاء من مجالات خبرة مكملة. لتقليل احتمال التحيز في المحتوى الناتج عن القرارات المتخذة فقط على أساس المعادلة الدلالية، يتم تضمين المشاركين من السكان المستهدفين الذين ستطبق عليهم الأداة. سوزا وآخرون يوصون بأن تتضمن هذه اللجنة متعددة التخصصات على الأقل عضوًا واحدًا من فريق البحث، محترفًا على دراية بمحتويات بناء الاستبيان (إذا أمكن من السكان المستهدفين)، وجميع المترجمين المشاركين في الترجمة والترجمة العكسية، باستثناء المترجم الذي عمل كحكم في تركيب الترجمات. قد تشمل أيضًا عضوًا أحادي اللغة يتحدث اللغة “الهدف”، غير مألوف ببناء الأداة لضمان تقليل التحيز. وفقًا لإركوت، يمكن للأعضاء الأحاديين اللغة اكتشاف التركيبات غير المألوفة بسهولة أكبر من ثنائي اللغة، حيث إنهم غير متأثرين بخبرتهم في “اللغة الأصلية”. يُوصى أيضًا بالتواصل مع مؤلفي الأدوات لتقديم رؤيتهم حول بناء الأداة وتوضيح أي أسئلة قد تطرأ. قد تنشأ القضايا التي يجب توضيحها مع المؤلفين من خلاف حول ترجمة عناصر معينة. يقترح بعض المؤلفين تضمين خبير لغوي لضمان المعادلة الدلالية والعبارية. قبل أن تجتمع اللجنة متعددة التخصصات، يقارن أحد الباحثين الترجمات العكسية مع الترجمات ومع “الأداة الأصلية” من أجل تحديد الغموض والاختلافات، والتي سيتم تقديمها ومناقشتها في اللجنة. إذا شارك خبير لغوي، يمكن طلب هذه النشاط من هذا الخبير، مما يسمح للباحث بالتركيز على المناقشات خلال الاجتماع وتوثيق الحلول المتفق عليها.
تهدف اللجنة متعددة التخصصات إلى الحصول على توافق بين جميع الخبراء بشأن: 1) الغموض والاختلافات المحتملة المتعلقة بالمعاني الثقافية؛ 2) التعبيرات العامية؛ 3) العبارات والكلمات و4) التعبيرات الاصطلاحية. فيما يتعلق بالتعبيرات الاصطلاحية، قد لا يكون التوصل إلى توافق أمرًا سهلاً. هذه هي تركيبات من الكلمات التي قد لا يكون من السهل ترجمتها، لأن لها معنى ثقافي محدد يختلف عن معناها الدلالي. إحدى الاستراتيجيات التي يمكن اتباعها في تنسيق التعبيرات الاصطلاحية هي تحديد التعبيرات الاصطلاحية القابلة للمقارنة ضمن “الثقافة المستهدفة”. يمكن للمشاركين من السكان المستهدفين تحديد التعبيرات الاصطلاحية المستخدمة في ثقافتهم بسهولة أكبر من المترجمين الذين ليس لديهم ملف تعريف محدد. المدخلات من المشاركين من السكان المستهدفين مهمة جدًا لضمان التكافؤ المفهومي والوظيفي للعناصر حيث تم العثور على غموض واختلافات. إجراءات اتخاذ القرار بشأن تنسيق العناصر التي تسعى إلى التعبير عن البحث عن التكافؤ المفهومي مع التكافؤ الوظيفي هي التركيز المزدوج. استخدامه مهم في دراسات التحقق عبر الثقافات حيث تستخدم الأدوات مصطلحات محددة قد لا يكون بعض المترجمين على دراية بها. وقد أكدت العديد من الدراسات التي أبلغت عن استبدال الكلمات والعناصر نتيجة لعملية التكيف عبر الثقافات على هذه الإجراءات. للاستبدال الجزئي أو الكلي للعناصر، يجب على الباحثين الحصول على موافقة من مطوري “الأداة الأصلية”.

الاختبار المسبق

قد تكون الترجمة العكسية الدقيقة غير كافية لضمان حل جميع الاختلافات الدلالية والمفهومية. يوفر إجراء اختبار مسبق تحديد المشكلات التي قد تؤثر على موثوقية وصلاحية النسخة المترجمة من الأداة، أي المتعلقة بوضوح وملاءمة عناصر الأداة. في حالة أدوات قياس المواقف، يكون الاختبار المسبق مهمًا حيث يمكن أن تكون الأسئلة حول المواقف حساسة في السياق الذي تشير إليه. في هذه الخطوة، يقيم الباحثون ملاءمة أداة القياس قبل استخدامها في الاختبار الميداني. يتضمن الاختبار المسبق جمع البيانات من عدد قليل من المشاركين من السكان المستهدفين، عادةً باستخدام نفس طريقة العينة كما هو مخطط للدراسة أو، بدلاً من ذلك، طريقة
العينة الملائمة. على أي حال، قد ينطوي تضمين أعضاء من السكان المستهدفين على خطر تلوث عينة الدراسة، حيث قد يستجيب المشاركون الذين تعرضوا للاختبار المسبق بشكل مختلف عن أولئك الذين لم يختبروا هذه التجربة، ويمكن تجنب ذلك عن طريق استبعاد هذه العناصر من العينة. عند اختبار أدوات القياس مسبقًا، يُوصى عادةً بإجراء اختبارين مسبقين تكميليين.
يتضمن الاختبار المسبق الأول استخدام المقابلة مع التقييم المعرفي لتقييم وضوح أداة القياس، وخاصة العناصر. تتكون المقابلة مع التقييم المعرفي من مجموعة من الأسئلة التي تُطرح بشكل فردي على مجموعة من المشاركين بعد أن أجابوا على الأداة. في الأداة، يطلب الباحثون من المشاركين تقييم وضوح جميع العناصر باستخدام مقياس ثنائي (“واضح”؛ “غير واضح”). بدلاً من ذلك، يمكن استخدام مقياس تقييم ثلاثي (“غير واضح”؛ “العنصر يحتاج إلى بعض المراجعة”، و”واضح جدًا”). بعد الإجابة، يطلب الباحثون اقتراحات لتحسين الصياغة فيما يتعلق بالعناصر التي تم وضع علامة عليها على أنها “غير واضحة” أو “تحتاج إلى بعض المراجعة”. نظرًا لأنه يتطلب حجم عينة موصى به من 30 مشاركًا، فإنه اختبار مسبق يستغرق وقتًا طويلاً. يستخدم الاختبار المسبق الثاني لجنة خبراء لتقييم أداة القياس بشكل نقدي، فيما يتعلق بملاءمة العناصر. يتم تقييم ملاءمة العناصر باستخدام مقياس ليكرت من 4 نقاط (1. “غير ذي صلة على الإطلاق”، 2. “ذو صلة إلى حد ما”، 3. “ذو صلة إلى حد كبير” و 4. “ذو صلة للغاية”، أو باستخدام مقياس ليكرت من 3 نقاط (“غير ذي صلة على الإطلاق”، “ذو صلة إلى حد ما”، و”ذو صلة جدًا”). بمجرد أن قد يقلل عدد كبير من الخبراء من إمكانية التوافق، نقترح اعتماد توصية المنصرة من 5 إلى 10 خبراء. تعد لجنة الخبراء إجراءً مناسبًا بشكل خاص في التكيف الثقافي للأدوات التي تستخدم مصطلحات محددة للغاية. بدلاً من لجنة الخبراء، قد يتضمن الاختبار المسبق الثاني إجراء مجموعة تركيز. هذه تقنية عادة ما تسبقها استبيان لإعداد مناقشة وتوفير بيانات إضافية للتحليل اللاحق. يجب أن يكون مشرف مجموعة التركيز قادرًا على موازنة مساهمات جميع المشاركين للحفاظ على سير المناقشة وتفسير المعلومات بشكل صحيح. وهذا يعني أنه/أنها يجب أن يتجنب التوافق المتحيز بسبب ديناميات المجموعة. بغض النظر عن النهج المنهجي، قد تتضمن كلا الاختبارين المسبقين طرقًا نوعية و/أو كمية. تحسن تنوع الطرق في الاختبار المسبق جودة التكيف الثقافي للأدوات.
لكل من تقييم وضوح العناصر وتقييم ملاءمتها، يتطلب مستوى أدنى من الاتفاق بين المشاركين لكل عنصر. بناءً على نتائج كل اختبار مسبق، قد يفكر الباحثون في مراجعة هذه العناصر وفقًا لذلك. يتطلب ذلك من الباحثين التحقق مما إذا كانت هناك شكوك في الترجمة تم الإبلاغ عنها لتلك العناصر المحددة وكيف تم حل هذه الشكوك. يسمح استشارة الوثائق الخاصة بالخطوات السابقة باستبعاد مشكلة التكافؤ الدلالي من أجل استبدال أو حذف العناصر من أداة القياس. لدعم القرار، يمكن تقديم البيانات التي تم الحصول عليها خلال مرحلة الاختبار المسبق إلى تحليل إحصائي يتعلق بتناسق ودقة درجة الاتفاق بين المراجعين. يمكن إجراء هذا التحليل عن طريق حساب مؤشر صلاحية المحتوى (CVI) لت quantifying صلاحية المحتوى للإصدار المعدل من الأداة. إنه مناسب للإجابات الثنائية ولكن يمكن أيضًا استخدامه لأساليب استجابة متعددة الخيارات من نوع ليكرت عن طريق إعادة ترميز الإجابات. لحساب CVI، قد يستخدم الباحثون نهجين: 1) حساب مؤشر صلاحية المحتوى لكل عنصر (I-CVI) و 2) حساب متوسط CVI لجميع العناصر المدرجة في الأداة (S-CVI/Ave). وفقًا لـ Polit et al، يجب مراجعة العناصر التي لديها I-CVI قريب من 0.78 ويجب استبعاد العناصر ذات I-CVI المنخفض. يوصي Polit et al بأن يتم الحكم على الأداة على أنها تتمتع بصلاحية محتوى ممتازة، يجب أن تحتوي العناصر على I-CVIs و S-CVI/Ave. نوصي بمراجعة جميع العناصر التي لديها CVI < 0.78 وإعادة تقييمها من قبل فريق البحث وأعضاء السكان المستهدفين.
نسبة صلاحية المحتوى (CVR) هي طريقة أخرى لت quantifying صلاحية المحتوى للتقييمات الثنائية على العناصر. هذه نهج اقترحه Lawshe، الذي يتضمن عددًا حرجًا من الخبراء يقيمون ملاءمة العناصر الفردية على أنها “أساسية”، “مفيدة ولكن ليست أساسية” أو “غير ضرورية”، وتدرج العناصر التي تعتبر “أساسية” في الأداة. تتراوح قيم CVR من -1 (اختلاف تام) إلى 5 (توافق تام). تشير القيم التي تزيد عن الصفر إلى أن أكثر من من خبراء اللجنة يتفقون على أن العنصر أساسي. عند تفسير CVR، من الضروري مراعاة ما إذا كان مستوى الاتفاق بين الخبراء أعلى مما قد يحدث بالصدفة. في هذا الصدد، يمكن اعتبار قيم CVR الحرجة التي قدمها Ayre & Scally، من قبل الباحثين المبتدئين لتحديد عدد خبراء اللجنة الذين يحتاجون إلى الاتفاق على أن العنصر أساسي وتحديد العناصر التي سيتم تضمينها أو مراجعتها بناءً على قيم CVR. على سبيل المثال، بالنظر إلى لجنة من 10 خبراء، يجب أن يتفق تسعة على الأقل على أن العنصر “أساسي”، يجب اعتبار CVR الحرج 0.8، العناصر ذات CVR ستدرج وتلك ذات CVR ستتم مراجعتها وإعادة تقييمها.
بالنسبة للمقاييس التصنيفية، يجب تقدير معامل كابا للتوافق (K). يسمح هذا المعامل بتقييم أكثر استقلالية حيث يعبر عن درجة الاتفاق بين المقيمين خالية من نسبة الاتفاق الناتجة عن الصدفة. لذلك، فهو مكمل مهم لقيم CVI. استخدامه مناسب فقط للبيانات الثنائية. يتم حساب معامل كابا من الصيغة التالية: ويختلف نظريًا بين -1 و بين 0.60 و 0.74 هو مؤشر على مستوى جيد من الاتفاق وبين 0.75 و 1.0 يشير إلى مستوى ممتاز. القيمة المقبولة الدنيا لـ K هي معامل الاتفاق قد ينتج تفسير موثوقية المقيمين للأداة من قيم CVI ومعامل كابا، جنبًا إلى جنب مع حساب ICC الذي يتم الحصول عليه لاحقًا في مرحلة التحقق النفسي. وبالتالي، يمكن تأجيل قرار حذف العناصر إلى هذه المرحلة بناءً على نتائج ICC. على الرغم من ذلك، يمكن تفسير نتائج CVI وكابا من حيث العوامل الأساسية والتدابير التي يمكن اتخاذها لتحسينها. بغض النظر عما إذا كان القرار مؤجلًا، كلما كان هناك حاجة لمراجعة العناصر وإعادة تقييمها، مع استبدالات جزئية أو كلية وإلغاءات، يجب على الباحثين التأكد من أن هذه الإجراءات لا تؤثر على تغطية البناء للأداة الأصلية.

اختبار الميدان

تتضمن هذه الخطوة إعداد النسخة شبه النهائية من أداة القياس لجمع البيانات في السكان المستهدفين وجمع البيانات الفعلي. قد تشمل إعداد الأداة بعض القرارات، وهي: 1) عكس تنسيقات استجابة العناصر التي تم صياغتها بشكل سلبي، و 2) حساب الحد الأدنى لحجم العينة الذي يمكّن من التحقق النفسي. تحتاج استجابات العناصر ذات الصياغة السلبية إلى أن تُعكس حتى لا تؤثر على تقييم معامل الموثوقية مع الارتباطات السلبية بين العناصر. لتحديد الحد الأدنى لحجم العينة، يمكن للباحثين استخدام المعيار المطلوب لإجراء تحليل العوامل من خمسة إلى عشرة مواضيع لكل عنصر من عناصر الأداة. كلما زادت هذه النسبة، زادت إمكانية الحصول على نموذج هيكل عامل قوي.

التحقق النفسي

التحقق النفسي هو التحقق القياسي أو التجريبي لأداة القياس. ليتم اعتبار الأداة صالحة، تحتاج إلى إنتاج نفس النتائج تحت نفس الظروف. يتضمن هذا التحقق: 1) إجراء تحليل استكشافي للعوامل؛ 2) تحليل الاتساق الداخلي و 3) إجراء تحليل تأكيدي للعوامل. تتطلب هذه الإجراءات من الباحثين أن يكون لديهم معرفة بمعالجة البيانات الإحصائية وأن يستخدموا برامج محددة لهذا الغرض. التحليل الأول الذي يجب إجراؤه هو التحليل الاستكشافي للعوامل، الذي يجمع عناصر أداة القياس في عوامل أو أبعاد بناءً على ارتباطاتها. يمكن أن تساعد مراجعة الأدبيات أو دراسة تحليل المفاهيم الباحثين في اتخاذ قرار مستنير بشأن عدد العوامل التي تم الحصول عليها من خلال التحليل الاستكشافي للعوامل. ثم يمكن معالجة هذه العوامل كمتغيرات جديدة ذات معنى وتسمى نظريًا من قبل الباحثين. يُعترف بالتحليل الاستكشافي للعوامل كطريقة استنتاجية لتوليد النظرية، والتي يتم تقييمها لاحقًا من خلال التحليل التأكيدي للعوامل. تتميز الطريقة الاستنتاجية باستخدام القياس لبناء أوصاف وتفسيرات نظرية للواقع. كما أنها تتيح للباحثين تحسين المفهوم الظاهرة قيد الدراسة بعد التحقق من أداة قياس معينة. يوفر استبعاد العناصر من “الأداة الأصلية” فرصة للباحثين لتحسين تصوراتهم حول الظاهرة التي يدرسونها. على الرغم من ذلك، فإن قرار الاحتفاظ بالعناصر أو استبعادها يعود إلى الباحث، مدعومًا بالتحليل السياقي لبناء الأداة.
بمجرد الحصول على هيكل العامل لأداة القياس، يقوم الباحثون بتحليل اتساقها الداخلي، مما يشير إلى درجة تكرار نتائجها. أكثر الطرق شيوعًا لتقييم الاتساق الداخلي هي من خلال معامل كرونباخ، الذي يقيس درجة الارتباط بين العناصر. يمكن أن يستند التفسير من معامل كرونباخ، إلى النطاقات التالية: 1) (قيمة ضعيفة)؛ 2) (قيمة مشكوك فيها)؛ 3) (قيمة مقبولة)؛ 4) (قيمة جيدة) و 5) (قيمة ممتازة). يعتبر بعض المؤلفين أن معامل كرونباخ، البالغ 0.70 مقبول لأدوات القياس التي يتم تحسينها واختبارها في عينات ثقافية مختلفة. يعتبر آخرون أنه في العلوم الاجتماعية، يعتبر معامل كرونباخ، الذي يتراوح بين 0.60 و 0.70 في الدراسات الاستكشافية مقبولاً. على الرغم من كونه المؤشر الأكثر استخدامًا لتقييم الاتساق الداخلي، يميل معامل كرونباخ، إلى التقليل من تقدير الموثوقية الكلية لقياس، مما يقدر الموثوقية بشكل محافظ. إحدى الطرق لمعالجة هذه المشكلة هي تعزيز التجانس من خلال توحيد العناصر قبل حساب المؤشر أو العمل مباشرة مع معاملات الارتباط (التباين الموحد)، مما يؤدي إلى مؤشر كرونباخ موحد. لتنقيح التحليل، يمكن أيضًا حساب معاملات الارتباط بين العناصر و
معامل الارتباط بين العنصر والإجمالي. تعتبر القيم بين 0.15 و 0.50 لمعاملات الارتباط بين العناصر مقبولة للبناء الشامل. بالنسبة لمعاملات الارتباط بين العنصر والإجمالي، تعتبر القيم التي تزيد عن 0.30 مقبولة. عندما يكون هيكل العامل متعدد الأبعاد، يقوم الباحثون بتحليل الاتساق الداخلي بالنسبة لكل من العوامل وبالنسبة للأداة الكلية. يتم تفسير النتائج التي تم الحصول عليها ومقارنتها بالقيم التي أبلغ عنها مؤلفو “الإصدار الأصلي”.
يتيح التحليل التأكيدي للعوامل للباحثين تحديد كيف يجب أن يبدو الهيكل النهائي لأداة القياس. تبدأ هذه التقنية الإحصائية من هيكل عامل مفترض تم الحصول عليه في التحليل الاستكشافي للعوامل ومن بيانات المشاركين لتحليل جدوى هذا الهيكل. يمكن تقييم جودة التكيف العام لنموذج هيكل العامل بناءً على قيم مرجعية لماروكو، فيما يتعلق بـ: 1) اختبار كاي-تربيع ( ، يجب أن تكون قيمته المرجعية منخفضة قدر الإمكان)؛ 2) مؤشر التكيف المقارن (CFI) حيث تعكس القيم و ، على التوالي، ملاءمة جيدة جدًا وجيدة؛ 3) مؤشر جودة التكيف (GFI)، التي تكون قيمها المرجعية هي نفسها مثل CFI؛ 4) جذر متوسط مربع خطأ التقريب (RMSEA)، الذي يجب أن يكون ؛ 5) مستوى دلالة RMSEA، P[rmsea] و 6) مؤشر التحقق المتقاطع المعدل (MECVI)، حيث يُفضل أن تكون القيمة أقل ما يمكن. قد يؤدي تأكيد ملاءمة نموذج العامل لأداة قياس استبعدت عناصر من “الإصدار المصدر” إلى اقتراح الباحثين نموذجًا جديدًا أو إطارًا مفاهيميًا للظاهرة قيد الدراسة. يتمتع النموذج المفاهيمي بنطاق محدود لشرح ظاهرة أو جزء منها، بينما يمثل الإطار المفاهيمي الظاهرة في شبكة وصفية من المفاهيم المترابطة التي تسهل فهمها.

تحليل الخصائص النفسية

يتطلب تقييم ملاءمة أي أداة تقييم تحليل غرضها، والأساس المفاهيمي، والتطوير، والخصائص النفسية. تت correspond الخصائص النفسية لأدوات القياس إلى مجموعة من الأدلة التي ينتجها الباحثون خلال عملية الترجمة، والتكيف، والتحقق الثقافي والنفسي، مما يسمح بتقييم صلاحية وموثوقية النتائج التي تم الحصول عليها. هناك تصنيفات مختلفة في الأدبيات لخصائص النفسية لأدوات القياس. توفر معايير التوافق المستندة إلى الإجماع لاختيار أدوات قياس حالة الصحة (COSMIN) أوصاف جودة منهجية توفر دليلًا منظمًا للأدلة التي تمكن الباحثين من تحليل الخصائص النفسية لأداة القياس في نهاية دراستهم. يجب أن يركز هذا التحليل على ثلاثة خصائص نفسية على الأقل: 1) صلاحية المحتوى؛ 2) صلاحية البناء و 3) الاتساق الداخلي. تحلل صلاحية المحتوى درجة انعكاس الأداة لمجال الاهتمام والتعريف المفهومي لبناء. داخل صلاحية المحتوى، يمكن تقييم صلاحية الواجهة، التي تسمح بفهم، من خلال آراء المراجعين الذين شاركوا في الاختبارات الأولية، ما إذا كانت الأداة تقيم فعلاً ما يدعي مؤلفوها أنها تقوم به. على الرغم من قياس معدلات الاتفاق، يجب ألا تعتبر صلاحية الواجهة بمفردها كمؤشر واقعي لصلاحية أدوات القياس. تشير صلاحية البناء إلى الدرجة التي تمكن بها أدوات القياس من إنتاج استنتاجات مشروعة يمكن استخلاصها من الدرجات المتعلقة بالبناء النظري التي تدعمها هذه الملاحظات. تعتبر هذه ميزة مركزية في عملية التحقق من صلاحية أدوات القياس وتشمل مصادر مهمة من الأدلة: 1) الأدلة المستندة إلى محتوى الاختبار، و 2) الأدلة المستندة إلى الهيكل الداخلي. تسمح معاملات العناصر الداخلية وإجمالي العناصر ودرجة تعديل نموذج العامل بإصدار أحكام حول صلاحية البناء. كما أن الصلاحية عبر الثقافات هي عنصر من عناصر صلاحية البناء. تشير إلى مدى انعكاس أداء العناصر في أداة معدلة ثقافياً على ذلك في “الإصدار الأصلي”. يعتبر أداء الترجمات المستقلة والمخفية واستخدام الأساليب المعتمدة على الفريق أمثلة تساهم في هذه الصلاحية. اعتمادًا على تصميم الدراسة، قد يخطط الباحثون لتقييم خصائص نفسية أخرى لم يتم الإبلاغ عنها من قبل مطوري “الأداة الأصلية”.

تداعيات للممارسة

تعتبر عملية الترجمة والتكيف والتحقق عبر الثقافات عملية طويلة ومعقدة قد يكون الباحثون خلالها غير مدركين للأساليب المنهجية المتاحة للتغلب على الحواجز المحتملة. توفر هذه الدراسة معلومات شاملة حول الأساليب المنهجية الموصى بها من قبل الإرشادات الحالية في مجال علوم الرعاية الصحية، لدعم الباحثين المبتدئين في تخطيط دراسات التحقق عبر الثقافات لأدوات القياس. بالإضافة إلى ذلك،
تسمح لهؤلاء الباحثين بالتركيز على المعرفة والمهارات حول الأساليب المنهجية النوعية والكمية التي يحتاجون إلى اكتسابها وتطويرها ليكونوا قادرين على إجراء دراسة تحقق. أخيرًا، تتيح للباحثين المبتدئين تطوير مهارات القيادة الجماعية في عملية البحث. يشمل ذلك ليس فقط تنسيق أنشطة فريق المترجمين والخبراء الذين يتكون منهم فريق البحث ولكن أيضًا توقع النتائج البحثية التي يمكن أن تتولد من عملية الترجمة والتكيف والتحقق عبر الثقافات. تشمل أمثلة هذه النتائج مقالة مراجعة أدبية حول بناء الأداة، ومقالة تحليل مفهوم، ومقالة منهجية توضح عملية الترجمة والتكيف عبر الثقافات، وأخرى تفصل جودة الخصائص النفسية للأداة.

استنتاج

هذه هي أول مراجعة أدبية منهجية تُجرى في علوم الرعاية الصحية تركز على الأساليب المنهجية الموصى بها من قبل الإرشادات الحالية. استنادًا إلى هذه المراجعة، تم تطوير إرشادات عملية لمساعدة الباحثين في عملية اتخاذ القرار خلال دراسات التحقق. إنها إرشادات عملية لأنها تتضمن معلومات شاملة وواسعة حول الأساليب المنهجية البديلة التي يمكن للباحثين استخدامها طوال العملية. تمكن هذه المعلومات الباحثين من إدارة تعقيد دراسات التحقق عبر الثقافات والحصول على أداة ذات خصائص نفسية معترف بها. على الرغم من أننا قد قصرنا مراجعة الأدبيات على مجال علوم الرعاية الصحية، فإن الإرشادات المقدمة تنطبق أيضًا على الترجمة والتكيف والتحقق من أدوات القياس في مجالات علمية أخرى. في المستقبل، نوصي بالبحث في تأثيرات استخدام إرشاداتنا العملية على تجربة الباحثين ونتائجهم عند إجراء دراسات التحقق عبر الثقافات.

شكر وتقدير

نود أن نشكر مشروع Handovers4SafeCare التابع لـ CIDNUR على قيادته لتطوير هذه الدراسة.

إفصاح

يبلغ المؤلفون عن عدم وجود تضارب في المصالح في هذا العمل.

References

  1. May C, Finch T, Rapley T. Normalization process theory. In: Nielsen P, Birken SA, editors. Handbook of Implementation Science. Edward Elgar Publishing; 2020:157.
  2. Portney LG. Designing surveys and questionnaires. In: Foundations of Clinical Research: Applications to Evidence-Based Practice. 4th ed. F.A. Davis Company; 2020:141-150.
  3. Chow S-C, Liu J-P. Basic statistic concepts. In: Design and Analysis of Clinical Trials. 2nd ed. Wiley-Interscience; 2004:47-54.
  4. Sidani S, Braden CJ. Examination of interventions’ acceptance. In: Nursing and Health Interventions: Design, Evaluation, and Implementation. 2nd ed. Wiley-Blackwell; 2021:218-225.
  5. Efstathiou G. Translation, adaptation and validation process of research intruments. In: Suohnen R, Stolt M, Papatravou E, editors. Individualized Care: Theory, Measurement, Research and Practice. Springer; 2019.
  6. Cha E-S, Kim KH, Erlen JA. Translation of scales in cross-cultural research: issues and techniques. J Adv Nurs. 2007;58(4):386-395. doi:10.1111/j.1365-2648.2007.04242.x
  7. Sutherland S. Outcomes research. In: Gray JR, Grove SK, editors. The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence. 9th ed. Elsevier; 2020:365.
  8. Miller LA, Lovler RL. How do we assess the psychometric quality of a test? In: Foundation of Psychological Testing: A Practical Approach. 6th ed. Sage Publications; 2020:326.
  9. Kristjansson EA, Desrochers A, Zumbo B. Translating and adapting measurement instruments for cross-linguistic and cross-cultural research: a guide for practitioners. Can J Nurs Res. 2003;35(2):127-142.
  10. Alagappan T. The cross-cultural adaptation process of a patient-reported outcome measure. J Sci Soc. 2023;50(1):13. doi:10.4103/jss. jss_136_21
  11. Sul SIR, Lucas PRMB. Translation and validation of the anticipated turnover scale for the Portuguese cultural context. Nurs Open. 2020;7 (5):1475-1481. doi:10.1002/nop2.521
  12. Almeida S, Nascimento A, Lucas PB, Jesus É, Araújo B. RN4CAST study in Portugal: validation of the Portuguese version of the Practice Environment Scale of the Nursing Work Index. Aquichan. 2020;20(3):1-10. doi:10.5294/aqui.2020.20.3.8
  13. Lucas P, Jesus E, Almeida S, Araújo B. Validation of the psychometric properties of the Practice Environment Scale of Nursing Work Index in primary health care in Portugal. Int J Environ Res Public Health. 2021;18(12):6422. doi:10.3390/ijerph18126422
  14. Anunciada S, Benito P, Gaspar F, Lucas P. Validation of psychometric properties of the Nursing Work Index: revised scale in Portugal. Int J Environ Res Public Health. 2022;19(9):4933. doi:10.3390/ijerph 19094933
  15. Carvalho M, Gaspar F, Potra T, Lucas P. Translation, adaptation, and validation of the Self-efficacy scale for clinical nurse leaders for the Portuguese culture. Int J Environ Res Public Health. 2022;19(14):8590. doi:10.3390/ijerph19148590
  16. Sousa E, Lin C-F, Gaspar F, Lucas P. Translation and validation of the indicators of quality nursing work environments in the Portuguese cultural context. Int J Environ Res Public Health. 2022;19(19):12313. doi:10.3390/ijerph191912313
  17. Cabrita C, Lucas P, Teixeira G, Gaspar F. Translation and validation of the Individual Workload Perception Scale: revised for Portuguese nurses. Healthcare. 2022;10(12):2476. doi:10.3390/healthcare10122476
  18. Gomes P, Ribeiro S, Silva M, et al. Cross-cultural validation of the Portuguese version of the Quality of Oncology Nursing Care Scale. Cancers (Basel). 2024;16(5):859. doi:10.3390/cancers16050859
  19. Cunha F, Pinto MR, Riesch S, Lucas P, Almeida S, Vieira M. Translation, adaptation, and validation of the Portuguese version of the Exercise of Self-Care Agency Scale. Healthcare. 2024;12(2):159. doi:10.3390/healthcare12020159
  20. Waltz CF, Strickland OL, Lenz ER. Other mesurement issues. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:446-448.
  21. Beaton D, Bombardier C, Guillemin F, Ferraz MB. Guidelines for the process of cross-cultural adaptation of self-report measures. Spine (Phila Pa 1976). 2000;25(24):3186-3191. doi:10.1097/00007632-200012150-00014
  22. Hedrih V. Test translation. In: Adapting Psychological Tests and Measurement Instruments for Cross-Cultural Research: An Introduction. Routledge; 2020:48-98.
  23. Nord C. Defining translation functions: the translation brief as a guideline for the trainee translator. Ilha Do Desterro. 1997;33:41-55.
  24. Montalt V, González-Davies M. Understanding medical communication. In: Medical Translation Step by Step: Learning by Drafting. Routledge; 2006:47.
  25. Epstein J, Santo RM, Guillemin F. A review of guidelines for cross-cultural adaptation of questionnaires could not bring out a consensus. Clin Epidemiol. 2015;68(4):435-441. doi:10.1016/j.jclinepi.2014.11.021
  26. Herdman M, Fox-Rushby J, Badia X. A model of equivalence in the cultural adaptation of HRQoL instruments: the universalist approach. Qual Life Res. 1998;7(4):323-335. doi:10.1023/a:1024985930536
  27. Peña ED. Lost in translation: methodological considerations in cross-cultural research. Child Dev. 2007;78(4):1255-1264. doi:10.1111/j.14678624.2007.01064.x
  28. Alonso J, Black C, Norregaard J-C, et al. Cross-cultural differences in the reporting of global functional capacity. Med Care. 1998;36 (6):868-878. doi:10.1097/00005650-199806000-00010
  29. Muniz J, Hambleton RK, Xing D. Small samples studies to detect flaws in item translations. Int J Test. 2001;1(2):115-135. doi:10.1207/ S15327574IJT0102_2
  30. Waltz CF, Strickland OL, Lenz ER. Other measurement issues. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:449-452.
  31. Riccio CA, Yoon H, McCormick AS. Neuropsychological test selection with clients who are Asian. In: Davis JM, D’Amato RC, editors. Neuropsychology of Asians and Asian-Americans: Practical and Theoretical Considerations. Spinger Publishing; 2014:153.
  32. Smith TW, et al. Developing and evaluating cross national survey instruments. In: Presser S, Rothgeb JM, Couper MP, editors. Methods for Testing and Evaluating Survey Questionnaires. Wiley Interscience; 2004. 439-442.
  33. van de Vijver F, Portinga YH. Conceptual and methodological issues in adapting tests. In: Hembletom RK, Merenda PF, Spilberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:41-47.
  34. Austin PC, Brunner LJ. Type I error inflation in the presence of a ceiling effect. Am Stat. 2003;57(2):97-104. doi:10.1198/0003130031450
  35. Holbrook A. Acquiescence response bias. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Vol. I. Sage; 2008:3.
  36. van de Vijver FJR, Poortinga YH. Towards an Integrated Analysis of Bias in Cross-Cultural Assessment. Eur J Psychol Assess. 1997; 13 (1):29-37. doi:10.1027/1015-5759.13.1.29
  37. Bartram D. Increasing validity with forced-choice criterion measurement formats. Int J Sel Assess. 2007;15(3):263-272. doi:10.1111/j.14682389.2007.00386.x
  38. Wivagg J. Forced choice. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:289-290.
  39. Maitland A. Attitudes measurement. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:37-38.
  40. Hilton A, Skrutkowski M. Translating instruments into other languages: development and testing processes. Cancer Nurs. 2002;25(1):1-7. doi:10.1097/00002820-200202000-00001
  41. Lino de CR, Brüggemann M, Souza M de L de OM, Barbosa de S, Santos Dos EKA. Adaptação transcultural de instrumentos de pesquisa conduzida pela enfermagem do Brasil: uma revisão integrativa. Texto Context – Enferm. 2018;26(4). doi:10.1590/0104-07072017001730017
  42. Guillemin F, Bombardier C, Beaton D. Cross-cultural adaptation of health-related quality of life measures: literature review and proposed guidelines. J Clin Epidemiol. 1993;46(12):1417-1432. doi:10.1016/0895-4356(93)90142-N
  43. Machado da R, Fernandes AD de BF S, Oliveira de ALCB, Soares LS, Gouveia de O MT, Silva da GRF. Métodos de adaptação transcultural de instrumentos na área da enfermagem. Rev Gaúcha Enferm. 2018;39. doi:10.1590/1983-1447.2018.2017-0164
  44. Acquadro C, Conway K, Hareendran A, Aaronson N. Literature review of methods to translate Health-Related Quality of Life Questionnaires for use in multinational clinical trials. Value Heal. 2008;11(3):509-521. doi:10.1111/j.1524-4733.2007.00292.x
  45. Farina N, Jacobs R, Sani TP, et al. Description of the cross-cultural process adopted in the STRiDE (STrengthening Responses to dementia in DEveloping countries) program: a methodological overview. Alzheimer’s Dement Diagnosis, Assess Dis Monit. 2022;14(1). doi:10.1002/ dad2. 12293
  46. Furukawa R, Driessnack M, Colclough Y. A committee approach maintaining cultural originality in translation. Appl Nurs Res. (2):144-146. doi:10.1016/j.apnr.2013.11.011
  47. Helmich E, Cristancho S, Diachun L, Lingard L. ‘How would you call this in English?’: being reflective about translations in international, cross-cultural qualitative research. Perspect Med Educ. 2017;6(2):127-132. doi:10.1007/S40037-017-0329-1
  48. Uysal-Bozkir Ö, Parlevliet JL, de Rooij SE. Insufficient cross-cultural adaptations and psychometric properties for many translated health assessment scales: a systematic review. J Clin Epidemiol. 2013;66(6):608-618. doi:10.1016/j.jclinepi.2012.12.004
  49. Albach CA, Wagland R, Hunt KJ. Cross-cultural adaptation and measurement properties of generic and cancer-related patient-reported outcome measures (PROMs) for use with cancer patients in Brazil: a systematic review. Qual Life Res. 2018;27(4):857-870. doi:10.1007/s11136-017-1703-5
  50. Praveen S, Parmar J, Chandio N, Arora A. A systematic review of cross-cultural adaptation and psychometric properties of oral health literacy tools. Int J Environ Res Public Health. 2021;18(19):10422. doi:10.3390/ijerph181910422
  51. Min SN, Duangthip D, Gao SS, Detsomboonrat P. Quality of the adaptation procedures and psychometric properties of the scale of oral health outcomes for 5-year-old children (SOHO-5): a systematic review. Qual Life Res. 2023;32(6):1537-1547. doi:10.1007/s11136-022-03280-2
  52. Danielsen AK, Pommergaard H-C, Burcharth J, Angenete E, Rosenberg J. Translation of questionnaires measuring health related quality of life is not standardized: a literature based research study. PLoS One. 2015;10(5):e0127050. doi:10.1371/journal.pone. 0127050
  53. Øygarden A-MU, Berg RC, Abudayya A, Glavin K, Strøm BS. Measurement instruments for parental stress in the postpartum period: a scoping review. PLoS One. 2022;17(3):e0265616. doi:10.1371/journal.pone. 0265616
  54. Echevarría-Guanilo ME, Gonçalves N, Romanoski PJ. Psychometric properties of measurement instruments: conceptual basis and evaluation methods: part II. Texto Context – Enferm. 2019;28(e20170311):1-14. doi:10.1590/1980-265x-tce-2017-0311
  55. Cruchinho P, Teixeira G, Lucas P, Gaspar F. Evaluating the methodological approaches of cross-cultural adaptation of the Bedside Handover Attitudes and Behaviours Questionnaire into Portuguese. J Healthc Leadersh. 2023;15:193-208. doi:10.2147/JHL.S422122
  56. Slade D, Murray KA, Pun JKH, Eggins S. Nurses’ perceptions of mandatory bedside clinical handovers: an Australian hospital study. J Nurs Manag. 2019;27(1):161-171. doi:10.1111/jonm. 12661
  57. Freudental-Pederson M, Hartmann-Peterson K, Nielsen LD. Mixing methods in the search for mobile complexity. In: Ficham B, Mark M, Murray L, editors. Mobile Methodologies. Palgrave McMillan; 2010:30.
  58. Peters M, Passchier J. Translating instruments for cross-cultural studies in headache research. Headache J Head Face Pain. 2006;46(1):82-91. doi:10.1111/j.1526-4610.2006.00298.x
  59. Weeks A, Swerissen H, Belfrage J. Issues, challenges, and solutions in translating study instruments. Eval Rev. 2007;31(2):153-165. doi:10.1177/0193841X06294184
  60. Wild D, Grove A, Martin M, et al. Principles of good practice for the translation and cultural adaptation process for patient-reported outcomes (PRO) measures: report of the ISPOR task force for translation and cultural adaptation. Value Heal. 2005;8(2):94-104. doi:10.1111/j.15244733.2005.04054.x
  61. Reichenheim ME, Moraes CL. Operacionalização de adaptação transcultural de instrumentos de aferição usados em epidemiologia. Rev Saude Publica. 2007;41(4):665-673. doi:10.1590/S0034-89102006005000035
  62. Sousa V, Rojjanasrirat W. Translation, adaptation and validation of instruments or scales for use in cross-cultural health care research: a clear and user-friendly guideline. J Eval Clin Pract. 2011;17(2):268-274. doi:10.1111/j.1365-2753.2010.01434.x
  63. Hagell P, Hedin P-J, Meads DM, Nyberg L, McKenna SP. Effects of Method of Translation of Patient-Reported Health Outcome Questionnaires: a Randomized Study of the Translation of the Rheumatoid Arthritis Quality of Life (RAQoL) Instrument for Sweden. Value Heal. 2010;13(4):424-430. doi:10.1111/j.1524-4733.2009.00677.x
  64. Lee WL, Chinna K, Lim Abdullah K, Zainal Abidin I. The forward-backward and dual-panel translation methods are comparable in producing semantic equivalent versions of a heart quality of life questionnaire. Int J Nurs Pract. 2019;25(1). doi:10.1111/ijn.12715
  65. Papadakis NM, Aletta F, Kang J, Oberman T, Mitchell A, Stavroulakis GE. Translation and cross-cultural adaptation methodology for soundscape attributes – a study with independent translation groups from English to Greek. Appl Acoust. 2022;200:109031. doi:10.1016/j. apacoust.2022.109031
  66. van de Vijver FJR, Poortinga YH. On the study of culture in developmental science. Hum Dev. 2002;45(4):246-256. doi:10.1159/000064985
  67. Petkovic J, Epstein J, Buchbinder R, et al. Toward ensuring health equity: readability and cultural equivalence of OMERACT patient-reported outcome measures. J Rheumatol. 2015;42(12):2448-2459. doi:10.3899/jrheum. 141168
  68. Bundgaard K, Nisbeth Brøgger M. “Don’t fix bad translations”: a netnographic study of translators’ understandings of back translation in the medical domain. MonTi Monogr Traducción e Interpret. 2018;1(10):205-224. doi:10.6035/MonTI.2018.10.8
  69. Hawkins M, Cheng C, Elsworth GR, Osborne RH. Translation method is validity evidence for construct equivalence: analysis of secondary data routinely collected during translations of the Health Literacy Questionnaire (HLQ). BMC Med Res Methodol. 2020;20(1):130. doi:10.1186/ s12874-020-00962-8
  70. Epstein J, Osborne RH, Elsworth GR, Beaton DE, Guillemin F. Cross-cultural adaptation of the Health Education Impact Questionnaire: experimental study showed expert committee, not back-translation, added value. J Clin Epidemiol. 2015;68(4):360-369. doi:10.1016/j. jclinepi.2013.07.013
  71. Teig CJP, Bond MJ, Grotle M, et al. A novel method for the translation and cross-cultural adaptation of health-related quality of life patient-reported outcome measurements. Health Qual Life Outcomes. 2023;21(1):13. doi:10.1186/s12955-023-02089-y
  72. Tsai T-I, Luck L, Jefferies D, Wilkes L. Challenges in adapting a survey: ensuring cross-cultural equivalence. Nurse Res. 2018;26(1):28-32. doi:10.7748/nr.2018.e1581
  73. Jayawickreme E, Jayawickreme N, Goonasekera MA. Using focus group methodology to adapt measurement scales and explore questions of wellbeing and mental health. Intervention. 2012;10(2):156-167. doi:10.1097/WTF.0b013e328356f3c4
  74. Montenegro M, Valdez D, Crawford B, Turner R, Lo W-J, Jozkowski KN. Using a decentering framework to create English/Spanish surveys about abortion: insights into comparative survey research (CSR) for new survey development and recommendations for optimal use. Soc Sci J. 2022;1-15. doi:10.1080/03623319.2022.2092379
  75. Vizcaya-Moreno MF, Pérez-Cañaveras RM. Country validation of the CLES-Scale: linguistic and cultural perspectives. In: Saarikoski M, Strandell-Laine C, editors. The CLES-Scale: An Evaluation Tool for Healthcare Education. Springer; 2018:31-46.
  76. Erkut S. Developing multiple language versions of instruments for intercultural research. Child Dev Perspect. 2010;4(1):19-24. doi:10.1111/ j.1750-8606.2009.00111.x
  77. Marcondes FB, de Vasconcelos RA, Marchetto A, de Andrade ALL, Filho AZ, Etchebehere M. Translation and cross-cultural adaptation of the Rowe score for Portuguese. Acta Ortop Bras. 2012;20(6):346-350. doi:10.1590/S1413-78522012000600007
  78. Nepal GM, Shrestha A, Acharya R. Translation and cross-cultural adaptation of the Nepali version of the Rowland Universal Dementia Assessment Scale (RUDAS). J Patient-Reported Outcomes. 2019;3(1). doi:10.1186/s41687-019-0132-3
  79. Coll-Risco I, Camiletti-Moirón D, Acosta-Manzano P, Aparicio VA. Translation and cross-cultural adaptation of the Pregnancy Physical Activity Questionnaire (PPAQ) into Spanish. J Matern Neonatal Med. 2019;32(23):3954-3961. doi:10.1080/14767058.2018.1479849
  80. Pereira GIDN, Costa CDDS, Geocze L, Borim AA, Ciconelli RM, Camacho-Lobato L. Cross-cultural adaptation and validation for Portuguese (Brazil) of health related quality of life instruments specific for gastroesophageal reflux disease. Arq Gastroenterol. 2007;44(2):168-177. doi:10.1590/s0004-28032007000200016
  81. Grundström H, Rauden A, Olovsson M. Cross-cultural adaptation of the Swedish version of Endometriosis Health Profile-30. J Obstet Gynaecol (Lahore). 2020;40(7):969-973. doi:10.1080/01443615.2019.1676215
  82. Polesello GC, Godoy GF, De Castro Trindade CA, De Queiroz MC, Honda E, Ono NK. Translation and cross-cultural adaptation of the modified Hip outcome tool (mhot) into Portuguese. Acta Ortop Bras. 2012;20(2):88-92. doi:10.1590/S1413-78522012000200006
  83. Muquith MA, Islam MN, Haq SA, Ten Klooster PM, Rasker JJ, Yunus MB. Cross-cultural adaptation and validation of a Bengali version of the modified fibromyalgia impact questionnaire. BMC Musculoskelet Disord. 2012;13(1):1. doi:10.1186/1471-2474-13-157
  84. Toma G, Guetterman TC, Yaqub T, Talaat N, Fetters MD. A systematic approach for accurate translation of instruments: experience with translating the Connor-Davidson Resilience Scale into Arabic. Methodol Innov. 2017;10(3):205979911774140. doi:10.1177/2059799117741406
  85. Poot CC, Meijer E, Fokkema M, Chavannes NH, Osborne RH, Kayser L. Translation, cultural adaptation and validity assessment of the Dutch version of the eHealth Literacy Questionnaire: a mixed-method approach. BMC Public Health. 2023;23(1):1006. doi:10.1186/s12889-023-15869-4
  86. Hasani L, Santoso H, Junus K. Instrument development for investigating students’ intention to participate in online discussion forums: crosscultural and context adaptation sing SEM. J Educ Online. 2021;18(3). doi:10.9743/JEO.2021.18.3.9
  87. Bundgaard K, Brøgger MN. Who is the back translator? An integrative literature review of back translator descriptions in cross-cultural adaptation of research instruments. Perspectives (Montclair). 2019;27(6):833-845. doi:10.1080/0907676X.2018.1544649
  88. Geisinger KF. Cross-cultural normative assessment: translation and adaptation issues influencing the normative interpretation of assessment instruments. Psychol Assess. 1994;6(4):304-312. doi:10.1037/1040-3590.6.4.304
  89. van Widenfelt BM, Treffers PDA, de Beurs E, Siebelink BM, Koudijs E. Translation and cross-cultural adaptation of assessment instruments used in psychological research with children and families. Clin Child Fam Psychol Rev. 2005;8(2):135-147. doi:10.1007/s10567-005-4752-1
  90. Son J. Back translation as a documentation tool. Int J Transl Interpret Res. 2018;10(2):89-100. doi:10.12807/ti.110202.2018.a07
  91. Coster WJ, Mancini MC. Recommendations for translation and cross-cultural adaptation of instruments for occupational therapy research and practice. Rev Ter Ocup da Univ São Paulo. 2015;26(1):50. doi:10.11606/issn.2238-6149.v26i1p50-57
  92. Ortiz-Gutiérrez S, Cruz-Avelar A. Translation and cross-cultural adaptation of health assessment tools. Actas Dermo-Sifiliográficas (English Ed. 2018;109(3):202-206. doi:10.1016/j.adengl.2018.02.003
  93. Ramada-Rodilla JM, Serra-Pujadas C, Delclós-Clanchet GL. Adaptación cultural y validación de cuestionarios de salud: revisión y recomendaciones metodológicas. Salud Publica Mex. 2013;55(1):57-66. doi:10.1590/S0036-36342013000100009
  94. Prakash V, Shah S, Hariohm K. Cross-cultural adaptation of patient-reported outcome measures: a solution or a problem? Ann Phys Rehabil Med. 2019;62(3):174-177. doi:10.1016/j.rehab.2019.01.006
  95. Fortes CPDD, Araújo de QC AP. Check list para tradução e adaptação transcultural de questionários em saúde. Cad Saúde Coletiva. 2019;27 (2):202-209. doi:10.1590/1414-462
  96. Hernández A, Hidalgo MD, Hambleton RK, Gómez-Benito J. International test commission guidelines for test adaptation: a criterion checklist. Psicothema. 2020;32(3):390-398. doi:10.7334/psicothema2019.306
  97. DuBay M, Watson LR. Translation and cultural adaptation of parent-report developmental assessments: improving rigor in methodology. Res Autism Spectr Disord. 2019;62:55-65. doi:10.1016/j.rasd.2019.02.005
  98. Hall DA, Zaragoza Domingo S, Hamdache LZ, et al. A good practice guide for translating and adapting hearing-related questionnaires for different languages and cultures. Int J Audiol. 2018;57(3):161-175. doi:10.1080/14992027.2017.1393565
  99. José M, Elosua P, Hambleton RK. Directrices para la traducción y adaptación de los tests: segunda edición. Psicothema. 2013;25(2):151-157. doi:10.7334/psicothema2013.24
  100. Santo RM, Ribeiro-Ferreira F, Alves MR, Epstein J, Novaes P. Enhancing the cross-cultural adaptation and validation process: linguistic and psychometric testing of the Brazilian-Portuguese version of a self-report measure for dry eye. J Clin Epidemiol. 2015;68(4):370-378. doi:10.1016/j.jclinepi.2014.07.009
  101. Arafat S, Chowdhury H, Qusar M, Hafez M. Cross cultural adaptation and psychometric validation of research instruments: a methodological review. J Behav Heal. 2016;5(3):129. doi:10.5455/jbh.20160615121755
  102. Kyriazos TA. Applied psychometrics: the 3-Faced Construct Validation Method, a routine for evaluating a factor structure. Psychology. 2018;09 (08):2044-2072. doi:10.4236/psych.2018.98117
  103. Plonsky L, Kim Y. Task-based learner production: a substantive and methodological review. Annu Rev Appl Linguist. 2016;36:73-97. doi:10.1017/S0267190516000015
  104. Peters MD, Godfrey C, McInerney P, Soares CB, Khalil H, Parker D. Development of a scoping review protocol. In: Aromataris E, Munn Z, editors. Joanna Briggs Institute Reviewer’s Manual. : The Joanna Briggs Institute; 2020
  105. Shekelle PG, Woolf SH, Eccles M, Grimshaw J. Developing clinical guidelines. West J Med. 1999;170(6):348-351.
  106. OECD Eurostat and World Health Organization. Classification of Health Care Providers (ICHA-HP). In: A System of Health Accounts 2011. OECD Publishing; 2017: 121-152. doi:10.1787/9789264270985-en
  107. Page MJ, McKenzie JE, Bossuyt PM, et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ. 2021: n71. doi:10.1136/bmj.n71
  108. Schreier M. Qualitative content analysis. In: Flick U, editor. The SAGE Handbook of Qualitative Data Analysis. Sage Publications; 2014:170-183.
  109. World Health Organization. Introduction. In: WHO Handbook for Guideline Developement. 2nd ed. World Health Organization; 2014:2
  110. Pernambuco L, Espelt A, Magalhães Junior HV, Lima de KC. Recomendações para elaboração, tradução, adaptação transcultural e processo de validação de testes em fonoaudiologia. CoDAS. 2017;29(3). doi:10.1590/2317-1782/20172016217
  111. International Test Comission. ITC Guidelines for Translating and Adapting Tests. International Test Comission; 2017.
  112. Tafforeau J, Cobo ML, Tolonen H, Christa S-N, Tinto A. Guidelines for the Development and Criteria for the Adoption of Health Survey Instruments; 2015. Available from: https://ec.europa.eu/health/ph_information/dissemination/reporting/healthsurveys_en.pdf. Accessed May 16, 2024.
  113. Høegh MC, Høegh S-M. Trans-adapting outcome measures in rehabilitation: cross-cultural issues. Neuropsychol Rehabil. 2009;19(6):955-970. doi:10.1080/09602010902995986
  114. McKenna SP. Measuring patient-reported outcomes: moving beyond misplaced common sense to hard science. BMC Med. 2011;9(1):86. doi:10.1186/1741-7015-9-86
  115. Prinsen CAC, Mokkink LB, Bouter LM, et al. COSMIN guideline for systematic reviews of patient-reported outcome measures. Qual Life Res. 2018;27(5):1147-1157. doi:10.1007/s11136-018-1798-3
  116. Mokkink LB, Prinsen CAC, Patrick DL, et al. COSMIN Study Design Checklist for Patient-Reported Outcome Measurement Instruments; 2019. Available from: https://www.cosmin.nl/wp-content/uploads/COSMIN-study-designing-checklist_final.pdf. Accessed May 16, 2024.
  117. Gjersing L, Caplehorn JR, Clausen T. Cross-cultural adaptation of research instruments: language, setting, time and statistical considerations. BMC Med Res Methodol. 2010;10(1):13. doi:10.1186/1471-2288-10-13
  118. Chávez LM, Canino GC Toolkit on Translating and Adapting Instruments; 2005. Available from: https://www.hsri.org/files/uploads/publica tions/PN54_Translating_and_Adapting.pdf. Accessed May 16, 2024.
  119. World Health Organization. WHO guidelines on translation: process of translation and adaptation of instruments; 2019. Available from: http:// www.who.int/substance_abuse/research_tools/translation/en/. Accessed May 16, 2024.
  120. Wild D, Eremenco S, Mear I, et al. Multinational trials-Recommendations on the translations required, approaches to using the same language in different countries, and the approaches to support pooling the Data: the ISPOR patient-reported outcomes translation and linguistic validation good research practices task force Report. Value Heal. 2009;12(4):430-440. doi:10.1111/j.1524-4733.2008.00471.x
  121. Swami V, Barron D. Translation and validation of body image instruments: challenges, good practice guidelines, and reporting recommendations for test adaptation. Body Image. 2019;31:204-220. doi:10.1016/j.bodyim.2018.08.014
  122. Kuliś D, Bottomley A, Velikova G, Greimel E, Koller M. EORTC Quality of Life Group Translation Procedure; 2017. Available from: https:// www.eortc.org/app/uploads/sites/2/2018/02/translation_manual_2017.pdf. Accessed May 16, 2024.
  123. Ohrbach R, Ohrbach J, Jezewski M, John MT, Lobbezoo F. Guidelines for Establishing Cultural Equivalency of Instruments; 2013. Available from: https://ubwp.buffalo.edu/rdc-tmdinternational/wp-content/uploads/sites/58/2017/01/Guidelines-for-Translation-and-Cultural-Equivalency-of-Instruments-2013_05_118608.pdf. Accessed May 16, 2024.
  124. Baker DL, Melnikow J, Ying Ly M, Shoultz J, Niederhauser V, Diaz-Escamilla R. Translation of health surveys using mixed methods. J Nurs Scholarsh. 2010;42(4):430-438. doi:10.1111/j.1547-5069.2010.01368.x
  125. Biering-Sørensen F, Alexander MS, Burns S, et al. Recommendations for translation and reliability testing of international spinal cord injury data sets. Spinal Cord. 2011;49(3):357-360. doi:10.1038/sc.2010.153
  126. Koller M, Aaronson NK, Blazeby J, et al. Translation procedures for standardised quality of life questionnaires: the European Organisation for Research and Treatment of Cancer (EORTC) approach. Eur J Cancer. 2007;43(12):1810-1820. doi:10.1016/j.ejca.2007.05.029
  127. Eremenco SL, Cella D, Arnold BJ. A comprehensive method for the translation and cross-cultural validation of health status questionnaires. Eval Health Prof. 2005;28(2):212-232. doi:10.1177/0163278705275342
  128. Dhamani KA, Richter MS. Translation of research instruments: research processes, pitfalls and challenges. Afr J Nurs Midwifery. 2011;13 (1):3-13.
  129. Sperber AD. Translation and validation of study instruments for cross-cultural research. Gastroenterology. 2004;126:S124-S128. doi:10.1053/j. gastro.2003.10.016
  130. Aaronson N, Alonso J, Burnam A, et al. Assessing health status and quality-of-life instruments: attributes and review criteria. Qual Life Res. 2002;11(3):193-205. doi:10.1023/a:1015291021312
  131. Organisation for Economic Co-operation and Development. Translation and adaptation guidelines for PISA 2012; 2012. Available from: https:// www.oecd.org/pisa/pisaproducts/49273486.pdf. Accessed May 16, 2024.
  132. Swami V, Todd J, Barron D. Translation and validation of body image instruments: an addendum to Swami and Barron (2019) in the form of frequently asked questions. Body Image. 2021;37:214-224. doi:10.1016/j.bodyim.2021.03.002
  133. Terwee CB, Prinsen CAC, Chiarotto A, et al. COSMIN methodology for evaluating the content validity of patient-reported outcome measures: a Delphi study. Qual Life Res. 2018;27(5):1159-1170. doi:10.1007/s11136-018-1829-0
  134. Yasir ASM. Cross Cultural Adaptation & Psychometric Validation of Instruments: step-wise Description. Int J Psychiatry. 2016;1(1). doi:10.33140/IJP/01/01/00001
  135. Regnault A, Herdman M. Using quantitative methods within the Universalist model framework to explore the cross-cultural equivalence of patient-reported outcome instruments. Qual Life Res. 2015;24(1):115-124. doi:10.1007/s11136-014-0722-8
  136. Mokkink LB, Terwee CB, Knol DL, et al. The COSMIN checklist for evaluating the methodological quality of studies on measurement properties: a clarification of its content. BMC Med Res Methodol. 2010;10(1):22. doi:10.1186/1471-2288-10-22
  137. Mokkink LB, Terwee CB, Patrick DL, et al. The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study. Qual Life Res. 2010;19(4):539-549. doi:10.1007/s11136-010-9606-8
  138. Terwee CB, Bot SDM, de Boer MR, et al. Quality criteria were proposed for measurement properties of health status questionnaires. Clin Epidemiol. 2007;60(1):34-42. doi:10.1016/j.jclinepi.2006.03.012
  139. Möhler R, Bartoszek G, Köpke S, Meyer G. Proposed criteria for reporting the development and evaluation of complex interventions in healthcare (CReDECI): guideline development. Int Nurs Stud. 2012;49(1):40-46. doi:10.1016/j.ijnurstu.2011.08.003
  140. American Educational Research Association. Standards for Educational and Psychological Testing. American Educational Research Association; 2014.
  141. Gudmundsson E. Guidelines for translating and adapting psychological instruments. Nord Psychol. 2009;61(2):29-45. doi:10.1027/19012276.61.2.29
  142. Forsyth BH, Kudela MS, Levin K, Lawrence D, Willis GB. Methods for translating an English-language survey questionnaire on tobacco use into mandarin, Cantonese, Korean, and Vietnamese. Field Methods. 2007;19(3):264-283. doi:10.1177/1525822X07302105
  143. American Psychological Association. Criteria for practice guideline development and evaluation. Am Psychol. 2002;57(12):1048-1051. doi:10.1037/0003-066X.57.12.1048
  144. Iliescu D. Pre-condition guidelines. In: Adapting Tests in Linguist and Cultural Adaptations. Cambridge University Press; 2017:87.
  145. Iliescu D. Documentation guidelines. In: Adapting Tests in Linguist and Cultural Adaptations. Cambridge University Press; 2017:105.
  146. Hambletom RK. Issues, designs and tecnical guidelines for adaptating tests into multiples languages and cultures. In: Hembletom RK, Merenda PF, Spilberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:3-38.
  147. Oakland T. Selected ethical issues relevant to test adaptations. In: Hambletom RK, Merenda PF, Spielberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:80.
  148. Brislin RW, Lonner WJ, Thorndike RM. Cross cultural research methods. In: Transcultural Psychiatric Research Review. Vol. 12. John Wiley ans Sons;1973:7-10. doi:10.1177/136346157501200101
  149. Beaton D, Bombardier C, Guillemin F, Ferraz MB. Recommendations for the cross-cultural adaptation of the DASH & QuickDASH outcome measure. Inst Work Heal. 2007;45.
  150. Ozolins U, Hale S, Cheng X, Hyatt A, Schofield P. Translation and back-translation methodology in health research: a critique. Expert Rev Pharmacoecon Outcomes Res. 2020;20(1):69-77. doi:10.1080/14737167.2020.1734453
  151. Bornman J, Sevcik RA, Romski M, Pae HK. Successfully translating language and culture when adapting assessment measures. J Policy Pract Intellect Disabil. 2010;7(2):111-118. doi:10.1111/j.1741-1130.2010.00254.x
  152. Simonsen E, Mortensen EL. Difficulties in translation of personality scales. J Pers Disord. 1990;4(3):290-296. doi:10.1521/pedi.1990.4.3.290
  153. Tanzer NK. Developing Tests for Use in Multiple Languages and Cultures: A Plea for Simultaneous Development. Lawrence Erlbaum Associates; 2005.
  154. Bennett PM. Reviewing translated scales: backtranslation under the spotlight. Transl Matters. 2022;4(125-144).
  155. van de Vijver F, Tanzer NK. Bias and equivalence in cross-cultural assessment: an overview. Eur Rev Appl Psychol. 2004;54(2):119-135. doi:10.1016/j.erap.2003.12.004
  156. de Klerk S, Jerosch-Herold C, Buchanan H, van Niekerk L. Shared decision making and the practice of community translation in presenting a pre-final Afrikaans for the Western Cape Disabilities of the Arm, Shoulder and Hand (DASH) questionnaire: a proposal for improved translation and cross-cultural adaptation. J Patient-Reported Outcomes. 2019;3(1):52. doi:10.1186/s41687-019-0144-z
  157. Erkut S. Developing multiple language versons of instruments for intercultural research. In: Ji M, editor. Cross-Cultural Health Translation: Exploring Methodological and Digital Tools. Routledge; 2019:9-10.
  158. Silverblatt A, Zlobin N. Production elements. In: International Communications: A Media Literacy Approach. Routledge; 2015:108.
  159. St Amant K. A new web for the new millennium. In: Lipson C, Day M, editors. Technical Communication and the World Wide Web. Lawrence Erlbaum Associates Publishers; 2005:148.
  160. Drasgow F, Probst TM. The psicometrics of adaptation: evaluating measurement equivalance across languages and cultures. In: Hambletom RK, Merenda PF, Spielberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates Publishers; 2005:361.
  161. Erkut S, Alarcón O, Coll CG, Tropp LR, García HAV. The dual-focus approach to creating bilingual measures. J Cross Cult Psychol. 1999;30 (2):206-218. doi:10.1177/0022022199030002004
  162. van der Vidjer F, Leung K. Equivalence and bias: a review of concepts, models, and data analytic procedures. In: Matsumoto D, van de Vijver F, editors. Cross-Cultural Research Methods in Psychology. Cambridge University Press; 2011:17-44.
  163. American Educational Research Association. Test design and development. Standards for Educational and Psychological Testing; American Educational Research Association; 2014. 81-84.
  164. van Teijlingen ER, Hundley V. Pilot study. In: Lewis-Back MS, Bryman A, Liao TF, editors. The SAGE Encyclopedia of Social Science Research Methods. Vol II. Sage; 2004:823-824.
  165. Gallagher PM. Pretest. In: Lewis-Back MS, Bryman A, Liao TF, editors. The SAGE Encyclopedia of Social Science Research Methods. Vol II. Sage Publications; 2004:853-854.
  166. Korabik K, van Rhijn T. Best practices in scale translation and establisment mesurement equivalence. In: Shockey KM, Shen W, Johnson RC, editors. The Cambridge Handbook of the Global Work-Family Interface. Cambridge University Press; 2018:212-229.
  167. Willis G. Pretesting of health survey questionnaires: cognitive interviewing, usability testing, and behavior coding. In: Johnson TP, editor. Handbook on Health Survey Methods. Willey; 2015:221.
  168. Rodrigues IB, Adachi JD, Beattie KA, MacDermid JC. Development and validation of a new tool to measure the facilitators, barriers and preferences to exercise in people with osteoporosis. BMC Musculoskelet Disord. 2017;18(1):540. doi:10.1186/s12891-017-1914-5
  169. Perneger TV, Courvoisier DS, Hudelson PM, Gayet-Ageron A. Sample size for pre-tests of questionnaires. Qual Life Res. 2015;24(1):147-151. doi:10.1007/s11136-014-0752-2
  170. Holyk GG. Question testing methods. In: Encyclopedia of Survey Research Methods. Vol II. Sage; 2008:658-659.
  171. van der Zouwen J, Smit JH, et al. Evaluating survey questions by analyzing patterns of behavior codes and question-answer sequences: a diagnostic approach. In: Presser S, Rothgeb JM, Couper MP, editors. Methods for Testing and Evaluating Survey Questionnaires. Wiley Interscience; 2004. 124.
  172. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res. 2003;25(5):508-518. doi:10.1177/0193945903252998
  173. Polit DF, Beck CT. Measurement and data quality. In: Nursing Research: Generating and Assessing Evidence for Nursing Practice. 9th ed. Wolker Klumer / Lippincott Williams & Wilkins; 2012:334.
  174. Linden B, Stuart H. Preliminary analysis of validation evidence for two new scales assessing teachers’ confidence and worries related to delivering mental health content in the classroom. BMC Psychol. 2019;7(1):32. doi:10.1186/s40359-019-0307-y
  175. Rubio DM, Berg-Weger M, Tebb SS, Lee ES, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res. 2003;27(2):94-104. doi:10.1093/swr/27.2.94
  176. Almanasreh E, Moles R, Chen TF. Evaluation of methods used for estimating content validity. Res Soc Adm Pharm. 2019;15(2):214-221. doi:10.1016/j.sapharm.2018.03.066
  177. DesRoches D. Establishment survey. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:124.
  178. Kelly J, Lavrakas PJ. Debriefing. In: Encyclopedia of Survey Research Methods. Vol I. Sage; 2008:181-182.
  179. Beatty P. Developing measures of health behavior and he alth service utilization. In: Johnson TP, editor. Handbook on Health Survey Methods. Willey; 2015:186-187.
  180. Polit DF, Beck CT, Owen SV. Is the CVI an acceptable indicator of content validity? Appraisal and recommendations. Res Nurs Health. 2007;30 (4):459-467. doi:10.1002/nur. 20199
  181. Yusoff MSB. ABC of content validation and content validity index calculation. Educ Med J. 2019;11(2):49-54. doi:10.21315/eimj2019.11.2.6
  182. Polit DF, Beck CT. Qualitative research design and approaches. In: Nursing Research: Generating and Assessing Evidence for Nursing Practice. 10th ed. Wolters Kluwer; 2017:489.
  183. Lawshe CH. A quantitative approach to content validity. Pers Psychol. 1975;28(4):563-575. doi:10.1111/j.1744-6570.1975.tb01393.x
  184. Ayre C, Scally AJ. Critical values for Lawshe’s Content Validity Ratio. Meas Eval Couns Dev. 2014;47(1):79-86. doi:10.1177/ 0748175613513808
  185. Stone KS, Frazier SK. Evaluation of measurement precision, accuracy, and error in biophysical data. In: Waltz CF, Strickland OL, Lenz ER, editors. Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:387-390.
  186. Cicchetti DV. On a model for assessing the security of infantile attachment: issues of observer reliability and validity. Behav Brain Sci. 1984;7 (1):149-150. doi:10.1017/S0140525X00026558
  187. Fleiss JL. Measuring nominal scale agreement among many raters. Psychol Bull. 1971;76(5):378-382. doi:10.1037/h0031619
  188. Kottner J, Audige L, Brorson S, et al. Guidelines for reporting reliability and agreement studies (GRRAS) were proposed. Int J Nurs Stud. 2011;48(6):661-671. doi:10.1016/j.ijnurstu.2011.01.016
  189. Osborne JW. Best Practices in Exploratory Factor Analysis. CreateSpace Independent Publishing; 2014.
  190. Lloret-Segura S, Ferreres-Traver A, Hernández-Baeza A, Tomás-Marco I. El análisis factorial exploratorio de los ítems: una guía práctica, revisada y actualizada. An Psicol. 2014;30(3). doi:10.6018/analesps.30.3.199361
  191. Field A. Why is my evil lecturer forcing me to learn statistics? In: Discovering Statistics Using IBM SPSS Statistics. 5th ed. Sage Publications; 2018:70-71.
  192. Kothari CR. Multivariate analysis techniques. In: Research Methodology: Methods and Techniques. 2nd ed. New Age Publisher; 2004:322.
  193. Haig BD. Exploratory factor analysis, theory generation, and scientific method. In: Method Matters in Psychology: Essays in Applied Philosophy of Science. Springer; 2018:65-88.
  194. Haig BD. Exploratory factor analysis, theory generation, and scientific method. Multivariate Behav Res. 2005;40(3):303-329. doi:10.1207/ s15327906mbr4003_2
  195. Råholm M-B. Abductive reasoning and the formation of scientific knowledge within nursing research. Nurs Philos. 2010;11(4):260-270. doi:10.1111/j.1466-769X.2010.00457.x
  196. Prudon P. Confirmatory factor analysis as a tool in research using questionnaires: a critique. Compr Psychol. 2015;4:03.CP.4.10. doi:10.2466/ 03.CP.4.10
  197. Eldridge J. Reliability, validity and trustworthiness. In: Boswell C, Cannon S, editors. Introduction to Nursing Research: Incorporating Evidence-Based Practice. 5th ed. Jones & Bartlettt Publishers; 2020:271-294.
  198. Abu-Bader SH. Working with SPSS. In: Using Statistical Methods in Social Science Research: With a Complete SPS Guide. 2nd ed. Oxford University Press; 2021:56.
  199. Perrin KM. Reliability and validity. In: Principles of Planning, Evaluation and Research for Health Care Programmes. 2nd ed. Jones &: Bartlett Learning; 2022:141.
  200. Grove SK. Quantitative measurement concepts. In: Gray JR, Grove SK, editors. Burns & Groves the Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence. 9th ed. Elsevier; 2021:462.
  201. Hair J, Hollingsworth CL, Randolph AB, Chong AYL. An updated and expanded assessment of PLS-SEM in information systems research. Ind Manag Data Syst. 2017;117(3):442-458. doi:10.1108/IMDS-04-2016-0130
  202. Field A. Exploratory factor analysis. In: Discovering Statistics Using IBM SPSS Statistics (North American Edition). 5th ed. Sage; 2018:1390-1391.
  203. Clark LA, Watson D. Constructing validity: new developments in creating objective measuring instruments. Psychol Assess. 2019;31 (12):1412-1427. doi:10.1037/pas0000626
  204. Moreira J. Questionários: Teoria e Prática. Almedina; 2004.
  205. Streiner DL, Norman GR, Cainey J. Basic concepts. In: Health Measurement Scales: A Practical Guide to Their Development and Use. 5th ed. Oxford University Press; 2015:8.
  206. Bryant F. Assessing the validity of measurement. In: Grimm LG, Yarnold PR, editors. Reading and Understanding More Multivariate Statistics. American Psychological Association; 2002:99-146.
  207. Marôco J, Etapas da análise de equações estruturais. 3rd. Análise de Equações Estruturais, 2021:55
  208. Sommer I, Larsen K, Nielsen CM, Stenholt BV, Bjørk IT. Improving clinical nurses’ development of supervision skills through an action learning approach. Nurs Res Pract. 2020;2020:1-10. doi:10.1155/2020/9483549
  209. Bowling A. Quality of life: concepts, measurements and patient perception. In: Research Methods in Health: Investigating Health and Health Services. 4th ed. Open University Press; 2014:54.
  210. Bot SM, Terwee CB, van der Windt DAWM, Boute LM, Dekker J, Vet de HCW. Psychometric evaluation of self-report questionnaires: the development of a checklist. In: Adér HJ, Mellenberg C, editors. Proceedings of the Second Workshop on Research Methodology. Vu University; 2003:161-168.
  211. Powers BA, Knapp TR. Face validity. In: Dictionary of Nursing Theory and Research. 3rd ed. Spinger Publishing; 2006:63.
  212. Soeken WKL. Validity of measures. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing Company; 2010:163.
  213. Streiner DL, Norman GR, Cairney J. Seleting the itens. In: Health Measurement Scales: A Practical Guide to Their Development and Use. 5th. Oxford University Press; 2015:92.
  214. Zumbo BD. Validity as contextualized and pragmatic explanation, and its implications for validation practice. In: Lissitz RW, editor. The Concept of Validity: Revisions, New Directions, and Applications. Information Age Publishing; 2009:68.
  215. Chan EKH. Standards and guidelines for validation practices: development and evaluation of measurement instruments. In: Zumbo BD, Chan EKH, editors. Validity and Validation in Social, Behavioral, and Health Sciences. Springer Publishing; 2014:9-24.
  216. Mokkink LB, Terwee CB, Knol DL, et al. Taxonomy and definitions. COSMIN Checklist Manual. 2012;9.
Journal of Multidisciplinary Healthcare

انشر عملك في هذه المجلة

مجلة الرعاية الصحية متعددة التخصصات هي مجلة دولية محكمة ومفتوحة الوصول تهدف إلى تمثيل ونشر الأبحاث في مجالات الرعاية الصحية التي يقدمها ممارسون من تخصصات مختلفة. يشمل ذلك الدراسات والمراجعات التي أجراها فرق متعددة التخصصات بالإضافة إلى الأبحاث التي تقيم نتائج أو سلوك هذه الفرق أو عمليات الرعاية الصحية بشكل عام. تغطي المجلة مجموعة واسعة جدًا من المجالات وترحب بالمساهمات من الممارسين على جميع المستويات، من جميع أنحاء العالم. نظام إدارة المخطوطات بالكامل عبر الإنترنت ويشمل نظام مراجعة الأقران سريع وعادل جدًا. قم بزيارةhttp://www.dovepress.com/testimonials.phpلقراءة اقتباسات حقيقية من مؤلفين تم نشرهم.

Journal: Journal of Multidisciplinary Healthcare
DOI: https://doi.org/10.2147/jmdh.s419714
PMID: https://pubmed.ncbi.nlm.nih.gov/38840704
Publication Date: 2024-05-01

Translation, Cross-Cultural Adaptation, and Validation of Measurement Instruments: A Practical Guideline for Novice Researchers

Paulo Cruchinho , María Dolores López-Franco , Manuel Luís Capelas , Sofia Almeida , Phillippa May Bennett , Marcelle Miranda da Silva , Gisela Teixeira , Elisabete Nunes , Pedro Lucas (1) , Filomena Gaspar (1) On Behalf of the Handovers4SafeCare Nursing Research, Innovation and Development Center (CIDNUR) of Lisbon, Nursing School of Lisbon, Lisboa, Portugal; CTS-464 Nursing and Innovation in Healthcare, University of Jaén, Jaén, Spain; Universidade Católica Portuguesa, Faculty of Health Sciences and Nursing, Center for Interdisciplinary Research in Health (CIIS), Lisboa, Portugal; Universidade Católica Portuguesa, Faculty of Health Sciences and Nursing, Center for Interdisciplinary Research in Health (CIIS), Porto, Portugal; Center for English, Translation, and Anglo-Portuguese Studies (CETAPS), Lisboa, Portugal; Faculty of Social Sciences and Humanities of the New University of Lisbon, Lisboa, Portugal; Faculty of Arts and Humanities of the University of Coimbra, Department of Languages, Literatures and Cultures, Coimbra, Portugal; Federal University of Rio de Janeiro, Anna Nery Nursing School, Rio de Janeiro, BrazilCorrespondence: Paulo Cruchinho, Nursing School of Lisbon, Avenida Prof. Egas Moniz, Lisboa, 1600-190, Portugal, Tel +35I 217913400, Email pjcruchinho@esel.pt

Abstract

Cross-cultural validation of self-reported measurement instruments for research is a long and complex process, which involves specific risks of bias that could affect the research process and results. Furthermore, it requires researchers to have a wide range of technical knowledge about the translation, adaptation and pre-test aspects, their purposes and options, about the different psychometric properties, and the required evidence for their assessment and knowledge about the quantitative data processing and analysis using statistical software. This article aimed: 1) identify all guidelines and recommendations for translation, cross-cultural adaptation, and validation within the healthcare sciences; 2 ) describe the methodological approaches established in these guidelines for conducting translation, adaptation, and cross-cultural validation; and 3) provide a practical guideline featuring various methodological options for novice researchers involved in translating, adapting, and validating measurement instruments. Forty-two guidelines on translation, adaptation, or cross-cultural validation of measurement instruments were obtained from “CINAHL with Full Text” (via EBSCO) and “MEDLINE with Full Text”. A content analysis was conducted to identify the similarities and differences in the methodological approaches recommended. Bases on these similarities and differences, we proposed an eight-step guideline that includes: a) forward translation; 2) synthesis of translations; 3) back translation; 4) harmonization; 5) pre-testing; 6) field testing; 7) psychometric validation, and 8) analysis of psychometric properties. It is a practical guideline because it provides extensive and comprehensive information on the methodological approaches available to researchers. This is the first methodological literature review carried out in the healthcare sciences regarding the methodological approaches recommended by existing guidelines.

Keywords: cross-cultural comparison, decision-making, psychometric properties, research design, validation studies, health services research

Introduction

Healthcare research requires the use of cross-culturally validated instruments to measure implementation of healthcare interventions and their outcomes through quantitative comparisons over time and across organizations. The use of data obtained through culturally adapted evaluation instruments allows researchers, policymakers, managers and, health professionals to gain a more analytical view of the phenomena under study and to develop internationally accepted and recognized theories on the provision of patient care, based on the comparison of local data with broader data. This approach also facilitates the identification of factors contributing to the effectiveness of healthcare intervention programs, or other forms of Outcomes Research. This type of quantitative research, focused on the quality of healthcare provision, requires valid and
reliable measuring instruments, obtained through cross-cultural validation studies. These studies aim to confirm the capacity of measurement instruments developed in one culture to produce meaningful results when applied in another culture. Measurement instruments can include questionnaires, tests, rating scales and self-reports, the latter being also known as Patient-Reported Outcomes Measures (PROMs).
In recent years we have conducted several cross-cultural validation studies of different measuring instruments, which constitute a significant contribution to the development of experimental designs in the field of nursing and health services research. Several studies across different scientific areas are characterized by the use of specific terminology and by seeking to archive various equivalences across cultures. Additionally, cross-cultural validation studies involve a long and complex process that require researchers to have a wide-ranging technical knowledge of the translation, back translation, adaptation, and pre-test aspects, their purposes and options, the different psychometric properties, and the required evidence for their assessment and knowledge about quantitative data processing and analysis using statistical software. Furthermore, these studies involve specific risks of bias, which may affect the research process and results. To address these challenges, novice researchers must be well-informed about the most suitable methodological approaches.

Concepts and Specifics Terms

The adaptation and testing of measurement instruments across different international contexts over time, not only enhances their reliability and validity, but also facilitates comparisons between cultures and the identification of relevant factors for developing effective interventions. Cross-cultural adaptation is not limited to the translation of measurement instruments. It encompasses the adaptation and validation of these instruments in the cultural context in which they are intended to be used.
Some specific terms are used in the process of cross-cultural adaptation. For example, the “target version” of a given measurement instrument is the version to be created through the process of cultural adaptation and the “target language” consists of the language into which the adaptation is intended. The “original version” is the version of the instrument that researchers intend to adapt and the “source language” is the language of the “original version”. Bilingual translators in the process of cross-cultural adaptation are individuals who have a full command of both the “target language” and the “original language”. Translation involves converting a document from the “source language” to the “target language”, considering the target audience, target culture, and the skopos (brief or communicative purpose). In the case of translating health instruments, this encompasses factors such as accuracy, fluency, and conceptual equivalence, but also, as argued by Montalt & Davies, the ethical priority of “cultural relevance”, while cross-cultural adaptation comprises the identification of differences between the “source culture” and the “target culture” to maintain the equivalence of concepts. Finally, cross-cultural validation aims to ensure that the “target instrument” works as intended and has the same properties as the “original instrument”. Within cross-cultural validation we can distinguish the psychometric validation performed after the field testing from the validation performed during pre-testing, which aims to validate the adapted version before its exploratory use.

Types of Equivalence

The purpose of cross-cultural adaptation consists of obtaining a measurement instrument in the “target language” that is conceptually equivalent to the original. Before researchers opt for a particular methodological approach for the translation, adaptation, and cross-cultural validation of measurement instruments, it is necessary to understand the different types of equivalence that can be achieved between the “target version” and the “original version”.
The equivalence can be specified in different categories varying according to the authors. Herdman et al proposed a set of five categories: 1) conceptual equivalence; 2) item equivalence; 3) semantic equivalence; 4) operational equivalence and 5) equivalence of measurement. Conceptual equivalence verifies which domains and their inter-relations are important in the “target culture” for the concept of interest evaluated by the instrument. Item equivalence critically examines the items covered by the concept domains, while semantic equivalence ensures that translations of items semantically match the items in the “original version”. Operational equivalence seeks to guarantee that the measurement methods used are appropriate in the “target culture” and measurement equivalence corresponds to the verification of the process result with reference to instrument’s behavior related to its psychometric properties. Each one of these categories is important for judging the overall equivalence of the measurement instruments, ie their functional equivalence. Peña, described another equivalence categories, namely: 1) functional equivalence; 2) cultural equivalence; 3) metric equivalence and 4) linguistic equivalence. The latter corresponds to the semantic
equivalence of Herdman et al. Functional equivalence assesses whether the instrument has the same behavior in both cultures. Cultural equivalence specifies how participants will answer to a given item covered by the same cultural meaning. Finally, metric equivalence concerns the difficulty of a given item being expressed in two different languages. According to Peña, the equivalences to be obtained in the cultural adaptation of measurement instruments depend on the objectives of the studies. To establish which equivalences obtain, researchers may choose one of these two categorizations. Understanding the different categories of equivalence enables researchers to design a methodological approach for cross-cultural adaptation procedures tailored to the types of equivalence sought. If researchers adopt a standardized methodological approach proposed by an author, it also allows them to supplement the process with other procedures better suited to the characteristics of their measurement instrument and target population. This is done with the purpose of achieving or strengthening a particular type of equivalence in the instrument.

Typologies of Biases

Another element that researchers need to understand before beginning the translation, adaptation and cross-cultural validation of measurement instruments is the risk of bias. Cultural biases pose the primary threat of this process. A measurement instrument is considered biased if two or more cultural versions are inadvertently affected by an undesirable source of variance, resulting from: 1) differences in concepts between the “source culture” and the “target culture”; 2) difference between the items used to represent the constructs in the instruments and 3) the method or form of administration used. Cultural biases are categorized into method bias, content bias, and construct bias based on their etiology. A challenge in cross-cultural adaptation of measurement instruments is managing different response styles across cultures, namely acquiescence, ceiling and floor effects, and the tendency toward neutral responses. These differences in response styles may be a source of method bias, and may be more expressive in certain cultures than others and related to the need to protect the identity and privacy, because of the presence of low levels of participants’ motivation and the valuing of social norms of politeness. Content bias can be introduced by items whose content is unfamiliar to the “target culture”, while construct bias occurs when there is only partial equivalence in the construct being measured between the cultures.
To mitigate these cultural biases during cross-cultural adaptation, researchers can employ several strategies. One strategy is to pre-test the instrument with a sample of participants from the “target culture”. Another strategy comprises conducting interviews with participants after the pre-test to assess their attributes and functioning. Despite there is no robust evidence to prevent method bias, researchers may recourse to a) forced-choice response formats without middle neutral points and b) use Likert scales with an extended number of response options. For instance, using 5 to 7 point response formats is deemed suitable for measuring attitudes. To save time and resources, it is important that researchers identify the risk of any of these biases as early as possible, preferably before conducting pre-tests.

Methodological Approaches

The translation, adaptation and validation of instruments requires methodological guidelines developed and proposed by experienced researchers. Despite this, several validation studies do not mention whether they adopted an internationally accepted guideline for their work. Some authors have highlighted a lack of detailed information on the fundamentals of methodological approaches and the options available to researchers. Literature reviews have also reported a lack of consensus on the methodological approaches to be followed in the process of translation, adaptation and cross-cultural validation. Cha et al attributed this lack of consensus not only to the specificity of research questions but also to the research environment, namely the accessibility and availability of bilingual translators. Farina et al have recently shown that rigorous and pragmatic cross-cultural adaptation can be achieved with limited resources. Faced with a lack of consensus, Epstein et al recommended choosing methods that best suit the context in which the evaluation instrument will be used. Furukawa et al noted that this choice depends on research objectives, the availability of translators, budget, and time constraints. Additionally, Helmich et al advocated that in order to produce results that truly reflect the context, the choice of methods must align with the epistemological position of the researchers.
Despite the lack of consensus, guidelines share some common elements. In a literature review carried out by Acquadro et al, it was found that in order to cross-culturally adapt the PROMs, the guidelines have in common a multistep and centralized process, at least one translation and some kind of pre-test. Regarding the questionnaires in general,
Epstein et al observed that most guidelines recommend an Expert Committee, Focus Groups, and back translation of the instrument.
Guidelines should cover not only translation and cross-cultural adaptation but also psychometric validation. Some reviews have reported a lack of knowledge about the psychometric properties of adapted measurement instruments, and incomplete information on all the psychometric validation domains. For example, Danielsen et al found that the psychometric properties of adapted versions validated with different tests, recommended the inclusion of a quantitative validation phase that includes one or more tests focused on content validity, criterion validity, reliability and construct validity. Additionally, in a scoping review of ygarden et al on measurement instruments for parental stress during the postpartum period, it was reported that none of the 15 instruments contained information on measurement error, responsiveness, and interpretability. Echevarría-Guanilo et al argue that researchers should have a comprehensive knowledge of psychometric properties to tailor the research design to the most appropriate psychometric properties of the instrument of interest.
Regarding methodological approaches, Machado et al identified the most widely used cross-cultural adaptation methods in nursing, and found studies where researchers added methodological approaches to the method they followed and studies where researchers did not comply with all the established methodological steps. Cruchinho et al in a study that evaluated the methodological approaches used in the process of translation and cross-cultural adaptation of the Bedside Handover Attitudes and Behaviours ( BHAB ) questionnaire reported the suplemental use of Dual-Focus to increase conceptual equivalence between the “source version” and the “target version”. A methodological approach is defined as the way in which a phenomenon is studied systematically, shaped by the researchers’ ontological and epistemological frameworks. Applied to cross-cultural validation studies, it can be defined as a way of studying the equivalences intended to be achieved through the translation, adaptation, and validation of measurement instruments.
In the cross-cultural adaptation of instruments, different methodological approaches can be used for translation, such as: 1) one-away translation; 2) Dual-Panel approach, and 3) forward and back translation. The one-away translation is the fastest and cheapest method, since it only includes bilingual individuals who translate the instrument into the “target language”. The forward and back translation is the most recommended method in translation guidelines. It requires at least two independent translators: one translates the instrument into the “target language”, and the other translates this version back into the “source language”. The Dual-Panel approach is a kind of Committee Approach involving a consensus translation by a panel of native bilinguals for the “target language”, along with a member of the research team adapting the measurement instrument. This consensus version is then reviewed by a second panel of monolingual target population members. It can also include a third panel to translate the translated version back into the “source language”. Lee et al found that both the forward-backward and Dual-Panel methods enable the production of semantically equivalent translations and highlight that translation alone cannot eliminate cultural discrepancies.
Papadakis et al’s study comparing translations by translators with different characteristics, emphasized the importance of translators preferably being bicultural and having some content knowledge of the instruments, ideally selected from the target population. In-depth knowledge of everyday contexts (beliefs, values, habits, symbols, expressions) enables culture be reduced to a set of core variables for a given construct and facilitates cross-cultural research. Members of the target population could be patients with literacy skills to enhance cross-cultural adaptation. In addition, Papadakis et al concluded that Principal Component Analysis of the measurement instruments is a methodology that can be used to compare translations carried out by translators with different profiles.
Methodological translation approaches can be symmetrical or asymmetrical. Symmetrical translations aim to make the instrument culturally relevant to the target population, while asymmetrical translations correspond to literal translations and maintain an one-to-one word correspondence. In a study that found some confusion among translators about which approach to take when performing back translations, whether more asymmetrical and literal or more symmetrical and understandable in the “target culture”, Bundgaard e Brøgger, stated that guidelines provide specific instructions on the translation process and strategy. This was to ensure clarity of item meaning and minimize threats to construct validity. In order to facilitate the negotiations of committees of translators in relation to the nuances of items and consequently minimize threats to construct validity, other authors have suggested providing a description of intentions for each of the items.
Cha et al argues that the Committee Approach contributes to acceptable internal consistency coefficients. Concurrently, Epstein et al found that carrying out a multidisciplinary expert committee contributes to obtaining rigorous items in the adaptation of a multidimensional instrument. Other authors have reinforced the relevance of different types of Committee Approach. For instance, Teig et al reported that using the Delphi method in an Expert Committee with the criteria of anonymity, controlled feedback and statistical responses, provides a more accurate measure of the degree of consensus of all the elements than if a meeting had been held without any formal voting system. Tsai-T-I described a process of cross-cultural adaptation that involved a panel of experts to determine the content validity of the original instrument before translating it into the target language. Also, Jayawickreme et al stated the importance of using a Focus Group series to promote the evaluation of translated items by a panel of experts.
Montenegro et al highlighted the importance of using Dual-Focus as a decentering strategy in the context of the Committee Approach. After forward-backward translation, items or parts of items that are not appropriate for the “target culture” may be identified. In these situations, decentering and Dual Focus can be used. Decentering is a translation procedure that does not require a literal translation, which is used to achieve idiomatic, grammatical-syntactical, experiential and conceptual equivalence between the two cultures. Dual-Focus involves replacing items or parts of items with more appropriate ones in the “target language” in order to mitigate the difficulty of adapting certain content from the “source culture”. It allows us to scrutinize what each of the items in the “original version” of the instrument seeks to assess in the light of the operational definition of the construct we want to measure, and thus, ensure that we are concerned with content validity. Several studies have reported the substitution of words and items as a result of using Dual-Focus.
The specific relevance of different methodological approaches has been justified in scientific literature. Toma et al highlighted the effect of combining the back translations with Cognitive Testing (also called Cognitive Interviewing and Cognitive Debriefing) in modifying five items of an instrument with each of these approaches. Comparing the results of the Cognitive Debriefing with the original instrument is essential to ensure cultural relevance, since it can reveal problems with wording, phrasing and resonance with individual’s world views. Hasani et al recommended the inclusion of Cognitive Debriefing in the research design together with the Expert Committee approach to ensure the validity and reliability of the measurement model. However, in an integrative literature review which analyzed how back translators were described in 105 empirical studies, Bundgaard e Brøgger found limited information on translators’ qualifications in empirical studies.
Back translation is the methodological approach whose importance has been justified in various ways. It was first advocated to limit the substitution of item content for cultural reasons. Subsequently, other researchers defended its use not as a method of equivalence, but rather as a way of checking the content of the items and the purpose of the instrument. More recently, the use of back translation has been argued as a documentation tool to show “what the translation says” and thus support researchers’ decision-making when adapting the instrument. Epstein et al concluded that back translation has little effect on the content and psychometric properties of a multidimensional instrument. Despite this, the same authors warned that back translation is an essential methodological approach for the authors of measurement instruments when they are not proficient in the “target language”.
Previously published guidelines and recommendations present a set of methodological approaches in a prescriptive way, that does not promote the researcher’s decision-making on the best options for the characteristics of their validation studies. To facilitate the decision-making process several authors have been proposed glossaries, decision trees, and checklists, which enable researchers to avoid gaps in the process that affect the quality of the final instrument, and promote the active role of researchers in conducting the processes. The scarcity studies comparing methodological approaches prevents the recommendation of a specific method, meaning the processes of translation, adaptation and cross-cultural validation dependent on skills, knowledge and time, something that young researchers may not always have. Peña and Arafat recommended developing guidelines to support researchers’ decisions throughout the process. Similary, Cruchinho et al called for comprehensive guidelines on methodological approaches for novice researchers decision-making. Comprehensive knowledge of methodological approaches is a prerequisite for cross-cultural validation studies of measurement instruments.

Research Rationale and Aims

The first guidelines produced for the healthcare field emerged from extensive literature reviews, including literature from the health, psychology, and sociology. In Brazil, an integrative review of nursing literature revealed an overemphasis on evaluating psychometric properties at the expense of exploring methodological approaches for translation and cross-cultural adaptation. To date, no study has identified the differences and similarities between existing guidelines in healthcare to support young researchers in the development of validation studies. Based on this, we formulated the following review question: – What similarities and differences exist in the methodological approaches recommended by existing guidelines on the process of translation, adaptation, and cross-cultural validation of measurement instruments in healthcare sciences? Therefore, this study aims to: 1) identify all guidelines and recommendations for translation, cross-cultural adaptation, and validation within the healthcare sciences; 2) describe the methodological approaches established in these guidelines, and 3) provide a practical guideline featuring various methodological options for novice researchers involved in translating, adapting, and validating measurement instruments. If you are planning to translate or adapt an measurement instrument, this article will assist you in critically choosing a methodological approach to obtain a valid, reliable, and unbiased instrument.

Materials and Methods

Identification of Existing Guidelines

A methodological review was undertaken for this study. Methodological review is a type of literature review focused on summarizing the state-of-the-art in methodological practices within a particular domain. In this methodological review, the focus was on the methodological approaches used for the translation, adaptation, and cross-cultural validation of measurement instruments recommended by guidelines in the field of healthcare sciences. For this methodological review, we used a three-stage search strategy. The initial search was limited to the “CINAHL with Full Text” (via EBSCO) and “MEDLINE with Full Text” databases and included an analysis of the text words in the titles, abstracts and indexed terms used to describe the manuscripts in each of these databases. The second search involved the Boolean expression (((MM “Instrument Adaptation”) OR “cross-cultural translation” OR “cross-cultural validation”) AND (“recommendations” OR “best practice”)) in the “CINAHL with Full Text” (via EBSCO), and “cross-cultural adaptation”[Title] OR “cross-cultural translation”[Title] OR “cross-cultural validation”[Title]) AND (“recommendation*”[Title/abstract] OR “best practice*”[Title/abstract] OR “methodological approach*”[Title/abstract])) in the “MEDLINE with Full Text”. Finally, we reviewed the reference lists of the manuscripts obtained to identify any guideline(s) that were not retrieved in the initial literature search in the databases. We used this search strategy because it allowed us to identify additional guidelines. The database search was carried out between September and October 2023 and it was repeated in February 2024 to capture any guidelines that had been subsequently published. To select the articles, our criteria were based on the concept that a guideline summarizes evidence and expert opinions, considering existing resources and the feasibility of procedures. The inclusion criteria for selecting the manuscripts were: 1) a scientific article focused on the process of translation, adaptation, or cross-cultural validation of measurement instruments; 2) describing a guideline to be followed in one of these processes; 3) written in English, Spanish, or Portuguese; and 4) published in a scientific journal in the field of healthcare sciences. To define the areas of healthcare, we used the Classification of Health Care Providers (ICHA-HP) framework, which describes the actors who provide health care (eg general and specialized physicians, nurses and midwives, physiotherapists and physical therapists, occupational and speech therapists, audiologists, dental hygienists, mental health specialists, etc.). The exclusion criteria for manuscripts were: 1) editorial articles, literature reviews, thesis, dissertations, or book chapters, or scientific articles not focused on the process of translation, adaptation or cross-cultural validation of measurement instruments; 2) articles that do not describe any guidelines to be followed in one of these processes; 3) guidelines that have already been included for eligibility; 4) articles written in a language other than those specified; and 5) articles published in a field other than healthcare sciences (eg economics and management, education science and sociology). Figure 1 shows the results of the search and the selection of studies.
Figure I PRISMA Flow Chart of literature review. Adapted from Page MJ, McKenzie JE, Bossuyt PM, et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ. 2021:n71. Creative Commons.

Content Analysis of Existing Guidelines

A content analysis was conducted, which included a total of 42 guidelines retrieved from the literature search. Based on this, we established two objectives: 1) to provide an overview of the range of methodological approaches included in the guidelines and 2) to identify the similarities and differences that exist in terms of the methodological approaches recommended. In a first step, all relevant excerpts from the guidelines focusing on methodological approaches were paraphrased, summarized, and structured. Based on these excerpts, paraphrases were formed, and categories were inductively generated. Subsequently, the categories generated were reviewed and grouped by similarities and differences into broader thematic categories. Finally, the paraphrases and categories derived from the guidelines were described narratively.

Proposal for a Practical Guideline

The development of guidelines is a multidisciplinary process that should include all relevant areas of expertise and perspectives. Based on the synthesis of the methodological approaches from existing guidelines, we have drawn up
a practical guideline based from an universalist perspective, enriched by contributions from experts in the fields of nursing management, statistics, and linguistics with experience in the translation and cross-cultural adaptation of health measurement instruments and in the supervision of novice researchers. Our recommendations are grounded in the common elements identified among the guidelines retrieved from the methodological review, and are supplemented by our own professional expertise.

Results

We reviewed 42 guidelines on the processes of translation, adaptation, and cross-cultural validation of measurement instruments. The guidelines included were published between 1993-2021, and most were published during the first two decades of the century (Figure 2). The main countries of publication were UK (7), Netherlands (7), USA (4), Canada (4), Spain (4), and Brazil (2) (Figure 3). The findings will be presented using the four thematic categories developed because of the analysis: general information, cross cultural translation, cross-cultural adaptation, and cross-cultural validation. Here, in keeping with the aims of this methodological review, we provide an overview of the similarities and differences of methodological approaches recommended by the guidelines about each thematic category.

General Information

Some guidelines recommend a preliminary stage before the translation of the instrument called preparation. This stage includes obtaining permission to use the instrument, without clarifying whether this permission is given by the authors of the instrument or by the publisher who holds the copyright to the articles. Other authors suggest that permission should be requested from the instrument’s publisher, the affiliation institution, or the authors. In addition, other authors indicate that permission should be obtained from the owner of the instrument’s intellectual property rights.
The initial phase also involves deciding which instrument to adapt cross-culturally. Some guidelines recommend that this decision should be based on checking that no version of the instrument exists for the target population, understanding their context, its purpose, features, the dimensions of the construct, the conceptual equivalence of the construct for the target population, its suitability for the intended clinical context, adequacy of psychometric properties, the existence of other cross-culturally adapted versions, and feasibility. Regarding feasibility, some authors specify factors such as completion time, cost and duration of the instrument, and the type and ease of administration. Other guidelines recommend only identifying the evidence on the quality of the selected instrument.
Figure 2 Distribution of guidelines by years.
Figure 3 Distribution of guidelines by countries.
To support the decision on which instrument to adapt, some authors recommend studying the relevance of the construct in the target population, as well as its conceptual framework, or meaning, which can be carried out through a literature review, open interview or Focus Group, or observation of members of the target population. Other authors emphasize the importance of researchers identifying early on the cultural and linguistic differences between the “target culture” and the “source culture”. To facilitate the translation and adaptation process, some authors propose developing a definition of the instrument’s constructs. Some guidelines recommend providing translators with information about the instrument’s construct, that can help translators resolve cultural and linguistic differences between the “source culture” and the “target culture”, eg scientific articles.
Also included in the preparation phase is the design of a protocol for the process of cross-cultural adaptation of the selected instrument. Some authors recommend researchers decide which method to use:1) the same language adaptation approach for instruments adapted in another country or population with the same language; 2 ) the universal approach for translations intended for multiple locations simultaneously; or 3) the country-specific approach for different translation versions developed for each subpopulation. The use of combined methodological approaches and procedures that maximize conceptual equivalence between the translated version and the “original version” is proposed by some authors, which may vary according to the particular characteristics of the studies and the resources available to the researchers. This includes setting up a multiprofessional team comprising translators and experts in the field of the instrument’s construct.
Few guidelines specify the leadership role of researchers within the team of translators and experts, for example in reviewing decisions to reconcile translations and in producing a more literal or more conceptual translation. Some special roles can be assumed by researchers, such as qualified moderators of Expert Committees, translation coordinators, or reviewers of proofreading after forward translation, back translation, pre-tests, and the final version of the adapted instrument. Some authors also advocate including members of the target population in the team when reviewing the cultural differences of the assessment instrument, and its developers, in the translation and cross-cultural adaptation process, and the study of the instrument’s measurement properties.
Many guidelines recommend documenting the translation process, cross-cultural adaptation, and validation in a report that describes all methodological approaches and procedures used, and their results, problems identified, proposed modifications, along with the names, roles and background of all those involved, the testing process, and the statistical analysis. Some authors recommend creating a template for continuous recording of the process. The information in this template can be used to prove the equivalence between the adapted and original versions
of the instrument and as supplementary material in the publication of a scientific article reporting on the process of crosscultural adaptation of the measurement instrument. McKenna, argues that the overall process should be reported.

Cross-Cultural Translation

Forward translation and subsequent back translation is recommended in some guidelines. Some authors propose forward translation without back translation, or suggest back translation as an option. The majority, also propose that forward translation and back translation be carried out independently. Despite this, some authors propose the use of collaborative approaches to translation, such as the Committee or Focus Group Approach, the Dual-Panel, the use of a Bilingual Committee, translation with teams of two translators, or two to four translators. Others authors recommend using the one way or expert’s translation by a committee when human or financial resources do not allow the back translation to be planned.
Regarding the number of translators, most guidelines suggest using at least two translators to translate the instrument and the same number for the back translation, or two translators for each of these approaches. Others propose at least two translators for forward translation and at least one for back translation, and others, at least one different translator for forward translation and back translation. Other authors recommend three translators for forward translation and one for back translation. Some of the guidelines that do not recommend back translation recommend using one translator, and two translators for the forward translation. Other authors recommend multiple translations without specifying a minimum number.
Some guidelines recommend that researchers give translators instructions on which translation approach to follow (whether more literal or more cultural), explaining the concepts of the measurement instrument and how to use its definitions in each of the items, which may involve the prior supply of materials. Others only recommend providing information about the purpose of the instrument, the target population and the aim of the translation if the study involves professional translators. Most authors recommend using native translators, who are bilingual in both the source and target languages. Other authors suggest that the translation process should include at least one different professional translator in both forward and back translation approaches, others establish only the inclusion of professional translators in both approaches, and others only for back translation.
In relation to the translators involved in forward translation, various characteristics are described, for example: 1) familiarity with the construct of the instrument; ) be a health professional familiar with the terminology used in the measurement instrument, or with experience in the clinical condition of interest; ) have translation experience; 4) have previous experience of PROMs, and 5) be a representative member of the target population. Some authors require having a translator familiar with the instrument’s construct and an unfamiliar translator, while others require two translators familiar with the instrument and the context. It is, also, recommended that translators taking part in back translation: 1) not have access to the “original instrument”, 2) are both naive about the construct to be measured, or one of them familiar with the construct area of the instrument and the other familiar with the linguistic and cultural nuances of the “source language”.
Most guidelines establish a synthesis or reconciliation stage after forward translation to identify and resolve discrepancies in the translation. To do this, some authors recommended using a third translator to reconcile the two versions of the forward translation, or one reviewer, or two. To obtain more accurate translations, researchers, also can provide materials to reconciliation translators. Some guidelines stipulate that the reviewer should reconcile the two translations into a single version together with the translators involved, including elements of the target population. To discuss and reach consensus on the differences found between forward translation versions, can be used the Committee Approach, Focus Group, or Delphi Panel. If a consensus cannot be reached on some of the discrepancies, one of the developers of the “original instrument” may be involved, or the use of an independent translator, who decides on the translation alone with input from the developers of the measurement instrument or another forward translator. Others recommend using the Delphi Panel to evaluate and resolve discrepancies between
the constructs with elements not involved in the previous translations but with extensive knowledge of the constructs to be measured. As an alternative to using a collaborative approach, some authors propose having the back translated version reviewed by an independent translator who decides on semantic equivalence by comparison with the “original version” of the measurement instrument. Other authors suggest that the forward and back translation versions be synthesized by the same independent translator.
With regard to deciding on the differences found, some authors argue that the meaning of an original term can be modified during the translation process if only part of the meaning is present in the “target culture” or if the term in the “target culture” expands the meaning of the term in the “source culture”. Some authors establish criteria based on source and comprehensibility, cultural appropriateness, grammar and terminology to support the reconciliation process decision.

Cross-Cultural Adaptation

To adapt instruments cross-culturally, several guidelines include the use of collaborative approaches in the form of Expert Committees. For some authors, the committee of experts aim to ensure only semantic equivalence, while for others additionally aim to ensure idiomatic, experiential equivalence, and conceptual equivalence. Authors with a narrower purpose call the committee the Bilingual Committee, and the authors with a broader purpose call the procedure carried out by the committee of experts the Harmonization procedure, and the committee, the Review Committee, or Multiprofessional Committee. The latter includes translators, linguists, methodologists and psychometricians. It may also include a monolingual element. Some authors also include members of the target population, who are preferably independent of the project team, who can be health professionals. Other authors promote holding a meeting with experts from the target population after the Expert Committee. The developer of the measument instrument may also participate if he or she is proficient in the “target language” or can be contacted to clarify any issues. In the denomination of the committee of experts, some authors have adopted the term “professionals” instead of “experts” because they consider that, in relation to PROMs, these individuals are the main experts.
Contact with the developers of the “original instruments” is advocated by some authors, especially when researchers want to eliminate items before psychometric analysis, or when omissions are identified in the measurement instrument. Regarding the adaptation of items, some authors advocate that items can be adapted to maintain their meaning when: 1) literal translation into the “target language” is not possible due to the lack of words or 2) the items in the “source language” include idiomatic expressions. The agreement of the instrument’s developers is required whenever parts of items need to be replaced, or of complete items. Some authors recommend avoiding the inclusion of new items and the elimination of parts of items or complete items prior to psychometric validation. Others consider the possibility of eliminating items, as long as they are items of low cultural relevance. The Decentering or Dual-Focus techniques are recommended for adapting items.
Most guidelines include pre-tests to cross-culturally adapt measurement instruments. 112,114,116-119,122-124,126-130,133 For some authors, the pre-test involves conducting cognitive debriefings with members of the target population, using Focus Group or a Delphi Panel, to evaluate the interpretation of items in the harmonized version and to identify wording that may be unclear. Cognitive debriefing interviews consist of: 1) asking participants to answer the questionnaire; ) paraphrase the participants’ understanding, item by item, in order to identify the items that may have translation problems; ) asking if they would write the items differently, how they selected their answers, if they identified any words they did not understand and if they considered any expressions unacceptable or offensive, and 4) asking about relevant topics that could be included in the questionnaire. There is no consensus on the number of participants in the group debriefing, which can involve between three and 10 participants, five to eight elements, at least eight, at least 10 elements, or with 10 to 15 participants from the target population. Respondents must be representative of the target population (eg in terms of gender, age, education and diagnosis). Other authors recommend the possibility of this debriefing being video or tape recorded. Several guidelines specify a cognitive debriefing with individual face-to-face interviews carried out with members of the target population, and preferably recorded. Also, there is no consensus on individual debriefings either, which can include five to eight respondents, at least seven patients or seven health professionals representing the target population, a sample of 30 elements, to 40 participants, and 25 to 75 respondents. Some guidelines recommend collecting sociodemographic information
from pre-test participants, the recording and transcription of cognitive interviews, and others the coding of the interviews by two independent researchers.
The qualities of the measurement instruments to be tested recommended by the authors are diverse. A clarity pre-test is included in several guidelines, as well as a pre-test of comprehensiveness, of acceptability, the relevance of the items, and the emotional impact of items. Some authors recommend assessing comprehensiveness and relevance separately, followed by a cognitive interview to assess clarity. Other authors suggest evaluating the coherence and comprehensiveness of the items, the operational aspects, along with relevance and clarity. Others propose evaluating clarity, comprehensiveness and acceptability. In relation to the PROMs, it is proposed to carry out pretests with patients to assess the relevance, the comprehensiveness, and the comprehensibility and with health professionals to evaluate only the relevance, and the comprehensiveness. Some authors include in the pre-test of comprehensiveness, evaluating the time needed to complete the instrument, by participants or researchers. Before administering the pretests, a critical review of the adapted instrument by members of the target population may also be included.
In the pre-tests evaluating clarity, relevance, comprehensiveness, coherence and operational aspects, it is suggested using a visual analog scale or a Likert-type scale to assess the content validity of the adapted instrument. To assess this type of validity, it is recommended to calculate the Content Validity Index (CV-I) of the measurement instrument and the CV-I of each item, and the Kappa Coefficient Agreement. Items with unacceptable values are reviewed and reevaluated. Some authors state that in conjunction with the assessment of content validity, also may be carried out a statistical analysis (eg, Rasch item analysis and Cronbach’s ). Keeping the adapted instrument with the same format of items and response options as the “original instrument” is recommended by some authors. Other authors recommend that the research team discuss the format, instructions, mode of administration and measurement methods used by the “original instrument” with the members of the target population. After the pre-test, some authors specify the need to decide on the form of dissemination of the instrument (whether through a paper questionnaire or an electronic questionnaire).

Cross-Cultural Validation

Many guidelines do not include psychometric validation as a step in the cross-cultural adaptation process. Others only include psychometric validation without covering the translation and crosscultural adaptation stages. Others provide information on the psychometric properties to be evaluated, and others detail information on statistical procedures and analysis methods for evaluating certain properties.
With regard to statistical procedures and methods, some authors include information on sample requirements for psychometric validation, namely that the number of participants should be taken into account on the basis of the number of missing values, the power of statistical testing, or that saturation is more important than sample size. Others specifically propose getting > 100 participants as a very good criterion for assessing internal consistency, measuring error and reliability, testing hypotheses for construct validity and comparing subgroups. Other authors propose a sample size of 100 and 200 respondents, and another at least 200 participants. Others indicate a ratio of 10 participants for each item in the instrument. Convenience sampling is recommended for sample selection, with characteristics relevant to the intended use of the instrument.
Regarding psychometric properties, we found a wide range of information. Some authors propose evaluating the reliability, while others specify the evaluation of the Cronbach’s the Interclass Correlation Coefficient (ICC), or K-index, as an indicator of test-retest reliability. To assess this property, it is recommended to apply the same adapted instrument to the same respondents at seven and 14 days. To assess internal consistency, several authors recommend using the Exploratory Factor Analysis (EFA) followed by Confirmatory Factor Analysis (CFA), or Exploratory Structural Equation Modeling as an alternative to confirmatory factor analysis. Others also include item-total correlation, inter-item correlation and Differential Item Functioning (DIF). The purpose of the DIF assessment is to compare the level of an item between two different groups of different levels using the same instrument or to identify items that may cause measurement bias. To assess cross-cultural validity, EFA followed by CFA is also recommended. Regarding the validity of the instrument, some
authors refer generically to its evaluation. Others specify the measurement of content validity, and construct validity, particularly by analyzing the factor structure of the instrument (dimensionality). Criterion validity is another recommended property, in particular discriminant validity, predictive validity, convergent validity, and concurrent validity. Some authors state that two or more instruments can be validated concurrently, especially when there are known relationships between their constructs. Finally, other authors propose the evaluation of measurement error, responsiveness, floor and ceiling effects, and hypothesis testing.
Based on the psychometric properties, some authors suggest evaluating the quality of the evidence for each measurement property, namely content validity (with evidence that the instrument’s items are relevant, clear and understandable in relation to the construct of interest and the population being studied), structural validity (with evidence of the factor analysis or Item Response Theory (IRT)/Rasch analysis), internal consistency (Cronbach’s ), cross-cultural/measurement invariance with evidence from DIF or Multigroup Confirmatory Factor Analysis, and the remaining measurement properties (reliability, measurement error, criterion validity, hypothesis testing for construct validity and responsiveness). Based on this evidence, some authors propose that researchers assess the degree of item and semantic equivalence, operational equivalence, functional equivalence and conceptual equivalence and measurement equivalence. For example, if factor analysis reveals structural differences between cultures, it is advisable to assume that the instrument is not equivalent between cultures. In such cases, it is recommended to resort to qualitative research methods to understand the reasons behind this lack of equivalence. In addition, some authors recommend comparing the psychometric properties obtained with those reported by the authors of the “original instrument”, and reviewing the adequacy of the psychometric properties with the team, as well as with experts in the field of the instrument’s construct and members of the target population.

Discussion

The use of a rigorous methodological approach helps minimizing the occurrence of biases during the process of translation, adaptation, and cross-cultural validation of measurement instruments. Although there is currently a wealth of guidelines in the literature, researchers often focus solely on the translation aspects and do not use them as a methodological guide in their studies. Some of this information has been disseminated as standards by some scientific organizations. For example, the International Test Commission has disseminated, in several languages, standards related to the decision of adapting a measurement instrument, the translation and adaptation process, the empirical validation process, the scoring and interpretation and the documentation of the procedures used. Additionally, in USA, the American Educational Research Association established a set of standards for assessing validity and reliability that includes characteristics of the design and development of measurement instruments. Several researchers across different fields have published models, guidelines, and detailed recommendations for the processes of translation, adaptation and cross-cultural validation. These guidelines vary in terms of prerequisites, the number of stages, the number and profiles of the translators involved, the configuration of the experts panel and their profiles, the inclusion of reviewers of the translations, methods of identifying bias, and the number and method of conducting pre-tests. In some scientific areas, there might even be a preference for using a single methodological approach. However, it is not mandatory to follow all the guidelines steps and procedures in the instrument validation once the guidelines may not be applicable to all studies’ characteristics. Even when researchers choose to follow a specific guideline to develop the process, this does not preclude the possibility of customizing the methodological approaches prescribed at each stage. Such customization can be justified on the types of equivalence to be achieved or reinforced and on the biases to be avoided.

Process Documentation

The identification of reasons for the different functioning of an adapted or validated version of a given measurement instrument can lead researchers to consider the possibility of bias during the process of translation, adaptation and crosscultural validation. To check this possibility, researchers need to ensure that the process is traceable with records in each stage. Those records allow, for example, that researchers verify that the low relevance of a particular item is not associated with any type of bias and may, as a result, be modified or excluded before the psychometric validation of the measurement instrument. At each stage, researchers involved in the process of adapting measurement instruments need to provide formal
written evidence of the probable relevance of the instruments to participants from the “target culture”, as well as of the operational equivalence of the instrument. The documentation of decisions may be empirical but most will be theoretical in nature. That documentation includes, by instance, information about the different stages of the process and the activities carried out at each one. It should also include information about the decisions, rationale and reasoning behind those decisions, as well as the professionals who participated in the different activities. Documentation of partial modification or removal of items is one of the main problems in the cultural adaptation of measurement instruments and requires adequate justification. These information must enable other researchers to understand and evaluate the work carried out, and to replicate the used procedures both in the same population and in others. Transferability is a key concept when a specific measurement instrument is used in different cultures and contexts. Considerations about the transferability of a measurement instrument are supported by documentation on the relevance of the construct, the measurement method used, the translation strategies adopted, and the cultural practices that may influence the results. Cruchinho et al made available the different versions of the cross-cultural adaptation process in supplementary material with the publication of the translation and cross-cultural adaptation process of the BHAB questionnaire. After writing your study protocol, be sure to create a documentation model in which you will record all the steps and all the methodological approaches to be used and their results.

Stages of the Process

Performing the field testing of the measurement instrument separates the translation, adaptation and cross-cultural validation procedures from the psychometric evaluation procedures which determine the global analysis of its properties. On this basis, we organized the overall process into eight sequential steps with distinct purposes, which are: 1) forward translation; 2) forward translation synthesis; 3) back translation; 4) harmonization; 5) pre-testing; 6) field testing; 7) psychometric validation and 8 ) analysis of the psychometric properties (Figure 4). Following, we will describe each one of these steps.

Forward Translation

Translation from one language to another is not always straightforward due to the variety of possibilities for translating a word or expression, and because there may not be an equivalent word in the “target language” to represent a particular term. Consequently, different translators may choose different translations options for the same instrument that do not coincide. To achieve a clear translation, Brislin, Lonner and Thorndike, produced a set of 12 guidelines. These recommendations establish the need for the items to: 1) include short, clear and simplified sentences; 2) use the active voice rather than the passive voice; 3) use nouns repeatedly rather than pronouns; 4) avoid the use of metaphors, regional phrases, idioms or colloquialisms; 5) not use the conjunctive mode of verb tenses; 6) use additional phrases to ensure understanding of item content; 7) not use items that include adverbs and prepositions; 8) avoid item content that includes possessive forms of words; 9) be specific; 10) not use vague descriptors; 11) familiarize the translator with item content, and 12) avoid more than one verb for item content that suggests different actions. The concern with the clarity of the items makes it possible to guarantee conceptual equivalence between the target and source versions. For this procedure, most methodological approaches propose a minimum of two different translators. Regardless of the number of translators, it is crucial that the translations are performed independently, that translators do not discuss the translation before completing it, and that their work is not affected by the knowledge that the translation will be subject to back translation. Ozolins, argues that if forward translators are aware that a document will be back translated, sometimes they can opt for more literal terms rather than choosing terms that are culturally appropriate in the “target language.”
Using professional translators working in the language pair in question allows comparisons of the versions of the measurement instrument in both languages, facilitating the identification of ambiguities and discrepancies, even when there is semantic equivalence. One of the main requirements is the familiarity with both cultures to be able to recognize situations and items for which a literal translation may be inadequate. Forward translators should also make suggestions for items in the culture in which the instrument is to be adapted, even if the item is left with a different meaning from the original. For example, translators can suggest replacing the terms “nursing assistants” and “advanced practice nurses”, respectively, by “auxiliary staff”, and “specialist nurses”, in the countries where these categories do not exist. In addition to being bicultural, some methodological approaches recommend only using professional translators. Others define the inclusion of translators who are native speakers of the “target language”, and have a specific profile, for example, being knowledgeable about the
Figure 4 Flowchart of the translation, adaptation and cross-cultural validation process.
construct of the instrument. To minimize the risk of content bias, members of the target population in which the measurement instrument is intended to be applied, may be involved in the translation. If members of the target population cannot be involved, members acquainted with the terminology used by the measurement instrument can be chosen. According to Hedrik, the translation of measurement instruments does not aim to obtain a precise translation but rather to obtain an adapted version equivalent to the “original version”. Ideally, there should always be two translators, one without a specific profile focused on semantic equivalence (preferably, a professional translator), and the other with expertise in the content area of the instrument’s construct to ensure conceptual equivalence. Translators who are not familiar with the construct of the instrument, more easily identify ambiguous meanings in the original instruments. During the translation of instruments, both translators record their doubts and comments in a form provided by researchers. Before translating, give instructions to translators about the type of translation intended, whether more literal or more cultural. If necessary, also provide materials in the “target language” that facilitate understanding of the construct of the measuring instrument.

Forward Translation Synthesis

In most guidelines for translation, adaptation and cross-cultural validation of instruments, independent translation is articulated with Team-Based Approaches to reach consensus among the involved translators. The method adopted at this stage to synthesize the two translations into a single version is called the Committee Approach. This approach consists of a meeting with the translators who participated in the previous step to discuss the translation differences and reach a consensus on the most appropriate translation for each item. The Committee Approach enables the detection of language and culture specific idiosyncrasies from the earliest stages of cross-cultural adaptation of measurement instruments. Some authors advocate the Committee Approach to be coordinated by a third translator proficient in both languages and without a specific profile. This coordinating element can facilitate the discussion and consensus processes between forward translators. For this purpose, before the meeting takes place, the researchers provide them with a comparative table with both translations and with the doubts and comments issued by each translator. They also ask the third translator to make a translation proposal based on the ambiguities and discrepancies detected in each item to be presented and discussed at the Committee meeting. During the meeting, one of the researchers moderates the discussions and records the decisions made. If it is not possible to involve a third translator, the translation proposal is made by a researcher. The report of this stage should describe the consensual solutions to resolve the ambiguities and discrepancies found. This report must be reviewed by the research team. If necessary, contact the developers of the measuring instrument to clarify possible doubts when translating the items.

Back Translation

Back translation is a quality assurance process to check the accuracy of the forward translation, and theoretically makes it possible to expand unclear wording and “gross inconsistencies/conceptual errors”, that need clarification. It involves the translation of the instrument from the “target language” (forward translation) into the “original language”, resulting in a back translation. Back translators are expected to provide a translation that is as ‘literal or faithful as possible, while still respecting the rules of the “target language”. They are also required to replicate any mistakes found in the forward translation and note down any discrepancies or non-natural sounding language. These comments are then documented on a form provided by the researchers. As the back translation process is so different from a standard translation process, it is important that translators are trained in what is involved in a back translation. The number and profile of the back translators should be identical to that of the forward translators. Almost all guidelines recommend that back translators are familiar with both languages and that they are native speakers of the language of the back translation (which is almost always English). If native speakers are unavailable, there should be at least two translators proficient in the “source language” and in the “target language”. More important than including native translators is conducting the back translation in a blinded manner, ie, back translators should not have access to the original measurement instrument, nor being informed about its construct. This characteristic ensures conceptual equivalence, however it is not always described in studies. It is particularly important to ensure all back translators are aware of this requirement, as translators are trained to understand the context as much as possible to provide an accurate translation. With the back translation of the measurement instrument, two versions of the instrument in the language
of the original document are generated. Regardless of whether minor discrepancies occur between the two versions, the main aspect that needs to be analyzed in the next step is whether there is a change in meaning between the items in the back translation and the items in the “original instrument”.

Harmonization

Similar to the translation synthesis stage, after obtaining the back translated versions, researchers should use a Team-Based Approach. At this stage, all versions of the measurement instrument (the original version, the translated version and the back translated version) are compared by all translators involved in order to identify possible ambiguities and discrepancies, and to decide on the most appropriate translation. The Team-Based Approach used at this stage consists of a Multiprofessional Committee. This approach is also referred to as a Committee of Experts, or a Harmonization Meeting. The Multiprofessional Committee consists of a meeting involving members from complementary areas of expertise. To reduce the possibility of content bias resulting from decisions made solely on the basis of semantic equivalence, participants from the target population in which the instrument is to be applied are also included. Sousa et al recommend this Multiprofessional Committee should include at least one member from the research team, one professional familiar with the questionnaire constructs’ contents (if possible from the target population), and all the translators involved in translation and back translation, with the exception of the translator who acted as the judge in the synthesis of the translations. It may also involve a monolingual member with mother tongue in the “target language”, unfamiliar with the constructs of the instrument to ensure bias reduction. According to Erkut, monolingual members can detect unfamiliar constructions more easily than bilinguals, as they are not influenced by their expertise in the “original language”. Contact with the authors of the instruments is also recommended in order to provide their insight into the construction of the instrument and clarify any questions that may arise. Issues to be clarified with authors may result from a disagreement on the translation of certain items. Some authors suggest the inclusion of a linguistic expert to ensure idiomatic and semantic equivalence. Before the Multiprofessional Committee meets, one of the researchers compares the back translations with the translations and with the “original instrument” in order to identify ambiguities and discrepancies, which will be presented and discussed in the Committee. If a linguistic expert participates, this activity may be requested from this expert, allowing the researcher to focus on the discussions during the meeting and the documentation of the agreed-upon solutions.
The Multiprofessional Committee aims to obtain consensus among all experts regarding: 1) possible ambiguities and discrepancies related to cultural meanings; 2) colloquialisms; 3) phrases and words and 4) idiomatic expressions. Regarding idiomatic expressions, consensus may not be easy. These are combinations of words which may not be easy to translate, because they have a specific cultural meaning different from their semantic meaning. One of the strategies that can be followed in the harmonization of idiomatic expressions, is to identify comparable idiomatic expressions within the “target culture”. Participants from the target population can identify idiomatic expressions that are used within their culture easier than translators with no specific profile. Inputs from participants of the target population are very important to ensure conceptual and functional equivalence of items where ambiguities and discrepancies were found. The decision procedure on the harmonization of items that seeks to articulate the search for conceptual equivalence with functional equivalence is the Dual-Focus. Its use is important in cross-cultural validation studies where the instruments use a specific terminology with which some translators are not familiar. Several studies reporting the substitution of words and items as a consequence of the cross-cultural adaptation process have underlined this procedure. For partial or total replacement of items, researchers must obtain approval from the developers of the “original instrument”.

Pre-testing

A rigorous back translation may be insufficient to guarantee that all semantic and conceptual discrepancies are resolved. Carrying out a pre-testing provides the identification of problems that may affect the reliability and validity of the translated version of the instrument, namely related to the clarity and relevance of the instrument’s items. In the case of attitude measurement instruments, pre-testing is important as questions about attitudes can be sensitive in the context to which they refer. In this step, researchers assess the suitability of the measurement instrument before its using in the field test. A pre-test involves data collection from a small number of participants of the target population, typically using the same sampling method as planned for the study or, alternatively, the method of
convenience sampling. Anyhow, the inclusion of members of the target population may involve a risk of contamination of the study sample, since participants who have been exposed to the pre-test may respond differently from those who have not had this experience, which can be avoided by excluding these elements from the sample. When pretesting measurement instruments, two complementary pre-tests are ideally recommended.
The first pre-test involves using the Interview with Cognitive Debriefing to assess the clarity of the measurement instrument, particularly of the items. The Interview with Cognitive Debriefing comprises a set of questions that are addressed individually to a set of participants after they have answered the instrument. In the instrument, researchers ask participants to rate the clarity of all items using a dichotomous scale (“it is clear”; “it is not clear”). Alternatively, could be used a trichotomous rating scale (“it is not clear”; “item needs some revision”, and”very clear”). After answering, researchers ask improvement suggestions to improve the wording in relation to the items marked as “unclear” or ‘needs some revision’. Because it involves a recommended sample size of 30 participants, it is a highly time-consuming pre-test. The second pre-test uses an Expert Panel to critically evaluate the measurement instrument, regarding the items relevance. The relevance of the items is assessed with a 4-point Likert scale (1. “not at all relevant”, 2. “somewhat relevant”, 3. “quite relevant” and 4. “highly relevant”, or with a 3-point Likert scale (‘not at all relevant’, ‘somewhat relevant’, and ‘very relevant’). Once a high number of experts may reduce the possibility of concordance, we propose to adopt the Almanasreh’s recommendation of 5 to 10 experts. The Experts Panel is a procedure specially suitable in cultural adaptation of instruments that uses a highly specific terminology. Alternatively to the Experts Panel, the second pre-test may involve to conduct a Focus Group. This is a technique usually preceded by a questionnaire to prepare a discussion and to provide additional data for subsequent analysis. The Focus Group moderator must be able to balance the contributions of all participants to keep the discussion going and interpret the information correctly. This means he/she must avoid consensus biased by the group dynamics. Regardless the methodological approach, both pre-tests may involve qualitative and/or quantitative methods. The diversity of methods in pre-testing improves the quality of cultural adaptation of instruments.
For both the assessment of items clarity and the assessment of its relevance, a minimum level of agreement among participants is required for each item. Based on the results of each pre-test, researchers may consider revising these items accordingly. This requires researchers to check whether translation doubts were reported for those particular item(s) and how these doubts were resolved. Consulting the documentation of the previous steps makes it possible to exclude a semantic equivalence problem in order to replace or eliminate items from the measurement instrument. To support the decision, the data obtained during the pre-test stage can be submitted to a statistical analysis regarding the consistency and accuracy of the degree of agreement between reviewers. This analysis can be performed by calculating the CVI to quantify the content validity of the adapted version of the instrument. It is suitable for dichotomous answers but can also be used for Likert-type multiple-choice response formats by recoding the answers. To calculate the CVI, researchers may use two approaches: 1) calculating each item’s content validity index (I-CVI) and 2) calculating the mean of the CVI of all items included in the instrument (S-CVI/Ave). According to Polit et al, items with a I-CVI near of 0.78 must be revised and items with low I-CVI must be excluded. Polit et al recommend that for an instrument to be judged as having excellent content validity, the items should have I-CVIs and S-CVI/Ave . We recommend that all items with a CVI< 0.78 be reviewed and reevaluated by the research team and members of the target population.
Content Validity Ratio (CVR) is another method to quantify the content validity of dichotomous ratings on items. This is an approach proposed by Lawshe, which includes a critical number of experts rating the relevance of individual items as “essential”, “useful but not essential” or “not necessary”, and those items considered “essential” are included in the instrument. CVR values range from -1 (perfect disagreement) to 5 (perfect agreement). Values above zero indicate that more than of the panel experts agree the item is essential. When interpreting the CVR, it is necessary to consider whether the level of agreement among the experts is above what may have occurred by chance. In this regard, the critical CVR values presented by Ayre & Scally, can be considered by novice researchers to determine how many panel experts need to agree an item is essential and decide which items will be included or reviewed based on CVR values. For example, considering a panel of 10 experts, at least nine must agree the item is “essential”, a critical CVR of 0.8 should be considered, items with CVR would be included and those with CVR be reviewed and reevaluated..
For categorial scales the Kappa Coefficient of Concordance (K) must be estimated. This coefficient allows a more independent assessment once it expresses a degree of inter-rater agreement devoid of the proportion of agreement that results from chance. Therefore, it is an important supplement to CVI values. Its use is suitable only for dichotomous data. Kappa Coefficient is calculated from the following formula: and varies theoretically between -1 e between 0.60 and 0.74 is an indicator of a good level of agreement and between 0.75 and 1.0 indicates an excellent level. The minimum acceptable value of K is a coefficient of agreement of The interpretation of the inter-rater reliability of the instrument may result from the CVI and Kappa Coefficient values, together with the calculation of the ICC obtained later in the psychometric validation stage. Consequently, the decision of deleting items can be postponed to this stage by the results of the ICC. Despite this, the CVI and Kappa results can be interpreted in terms of the underlying factors and the measures that can be taken to improve them. Regardless of whether the decision is deferred, whenever there is a need to revise reevaluate items, with partial or total substitutions and eliminations, researchers should ensure that such procedures do not compromise the construct coverage of the original instrument.

Field Testing

This step involves preparing the pre-final version of the measurement instrument for data collection in the target population and the actual data collection. The preparation of the instrument may include some decisions, namely: 1) reversing the response formats of items that were negatively phrased, and 2) calculating a minimum sample size that enables the psychometric validation. Negatively worded item responses need to be reversed in order to not affect the evaluation of the reliability coefficient with negative inter-item correlations. To determine the minimum sample size, researchers can use the criterion required for conducting factor analysis of five to 10 subjects per instrument item. The higher this ratio, the greater the possibility of obtaining a robust factor structure model.

Psychometric Validation

Psychometric validation is the metric or empirical validation of a measurement instrument. To be considered valid, an instrument needs to produce the same results under the same conditions. This validation comprises: 1) performing an EFA ; 2) analyzing the internal consistency and 3) performing a CFA. These procedures require researchers to have knowledge of statistical data processing and to use specific software for this purpose. The first analysis to be performed is the EFA, which groups the items of the measurement instrument into factors or dimensions based on their correlations. Conducting a literature review or concept analysis study can help researchers make an informed decision about the number of factors obtained through EFA. Then, these factors can be processed as new meaningful variables and are theoretically named by researchers. EFA is recognized as an abductive method of theory generation, which is further evaluated by CFA. The abductive method is characterized by the use of analogy to construct descriptions and theoretical explanations of reality. It also allows researchers to conceptually refine the phenomenon under study after validating a particular measurement instrument. The exclusion of items from the “original instrument” provides an opportunity for researchers to refine their conceptualization about the phenomenon they are studying. Despite that, the decision to retain or exclude items rests with the researcher, supported by the contextual analysis of the instrument’s construct.
Once obtained the factor structure of the measurement instrument, researchers analyze its internal consistency, which indicates the degree of repeatability of its results. The most common method for assessing internal consistency is through the Cronbach’s , which measures the degree of correlation between items. The interpretation from the Cronbach’s can be based on the following ranges: 1) (weak value); 2) (questionable value); 3) (acceptable value); 4) (good value) and 5) (excellent value). Some authors consider acceptable a Cronbach’s of 0.70 for measurement instrument that are being refined and tested in culturally different samples. Others consider that in Social Sciences it is acceptable a Cronbach’s ranging between 0.60 and 0.70 in exploratory studies. Despite being the most widely used index for assessing internal consistency, Cronbach’s tends to underestimate the total reliability of a measure, estimating reliability conservatively. One approach to address this issue is to promote homogeneity by standardizing items before calculating the index or to work directly with correlation coefficients (standardized covariance), which results in a standardized Cronbach’s index. To refine the analysis, it can also be calculated the inter-item correlation coefficients and
the item-total correlation. Values between 0.15 and 0.50 for the inter-item coefficients are considered acceptable for comprehensive constructs. For the item-total coefficients, values above 0.30 are considered acceptable. When the factor structure is multidimensional, researchers analyze the internal consistency in relation to each of the factors and in relation to the total instrument. The results obtained are interpreted and compared with the values reported by the authors of the “original version”.
CFA allows researchers to specify how the final structure of the measurement instrument should look like. This statistical technique starts from a hypothesized factor structure obtained in the EFA and from the participants’ data to analyze the feasibility of this structure. The quality of the global adjustment of the factor structure model can be assessed based in Marôco’s values of reference, regarding: 1) Chi-square test ( , whose reference value should be as low as possible); 2) Comparative Fit Index (CFI) where values and reflect, respectively, a good and very good fit; 3) Goodness of Fit Index (GFI), whose reference values are the same as the CFI; 4) Root Mean Square Error of Approximation (RMSEA), which must be ; 5) significance level of RMSEA, P[rmsea] and 6) Modified Expected Cross-Validation Index (MECVI), being desirable the lowest possible value. The confirmation of the adequacy of the factor model of a measurement instrument that has excluded items from the “source version” may lead researchers to propose a new model or conceptual framework for the phenomenon under study. The conceptual model has a limited scope of explaining a phenomenon or part of it, whereas a conceptual framework represents the phenomenon in a descriptive network of interconnected concepts that eases its understanding.

Psychometric Properties Analysis

The assessment of the adequacy of any assessment instrument requires the analysis of its purpose, conceptual basis, development, and psychometric properties. The psychometric properties of measurement instruments correspond to a set of evidences produced by researchers during the process of translation, adaptation and cross-cultural validation and psychometric, which allow to assess the validity and reliability of the results obtained. There are different classifications in the literature for the psychometric properties of measurement instruments. The Consensus Based Standards for the Selection of Health Status Measurement Instruments (COSMIN) methodological quality assessment descriptors provide a structured guide to the evidence that enables researchers to analyze the psychometric properties of the measurement instrument at the end of their study. This analysis should focus on at least three psychometric properties: 1 ) content validity; 2 ) construct validity and 3 ) internal consistency. Content validity analyses the degree to which an instrument reflects the domain of interest and the conceptual definition of a construct. Within content validity, face validity can be assessed, which allows understanding, through the opinions of the reviewers who participated in the pretests, whether the instrument actually assesses what its authors claim it does. Despite the quantification of the agreement rates, face validity should not be considered alone as a factual indicator of validity of measurement instruments. Construct validity refers to the degree to which measurement instruments enable to produce legitimate inferences to be drawn from scores for theoretical constructs and on which these observations are supported. This is a central feature in the process of validating measurement instruments and encompasses important sources of evidence: 1) the evidence based on the content of the test, and 2) the evidence based on the internal structure. The inter-item and total-item coefficients and the degree of adjustment of the factor model allow judgments to be made about construct validity. Cross-cultural validity is also an element of construct validity. It indicates the extent to which the performance of items in a culturally adapted instrument reflects that in the “original version”. The performance of independent, blinded translations and the use of Team-Based Approaches are examples that contribute to this validity. Depending on the study design, researchers may plan to evaluate other psychometric properties that were not reported by the developers of the “original instrument”.

Implications for Practice

The process of translation, adaptation, and cross-cultural validation is a long and complex process during which researchers may be unaware of the possible methodological approaches available to overcome possible barriers. This study provides comprehensive information on the methodological approaches recommended by existing guidelines in the field of healthcare sciences, to support novice researchers in planning cross-cultural validation studies of measurement instruments. In addition, it
allows these researchers to focus on the knowledge and skills about qualitative and quantitative methodological approaches that they need to acquire and develop to be able to conduct a validation study. Finally, it allows novice researchers to develop team leadership skills in the research process. This includes not only coordinating the activities of the team of translators and experts that comprise the research team but also foreseeing the research outputs can be generated with the process of translation, adaptation, and cross-cultural validation. Examples of such outputs include a literature review article on the construct of the instrument, a concept analysis article, a methodological article reporting the process of translation and crosscultural adaptation, and another detailing the psychometric properties’ quality of the instrument.

Conclusion

This is the first methodological literature review conducted in the healthcare sciences that focuses on the methodological approaches recommended by existing guidelines. Based on this review, a practical guideline was developed to assist researchers in the decision-making process during validation studies. It is a practical guideline because it includes extensive and comprehensive information about alternative methodological approaches that researchers can use throughout the process. This information enables researchers to manage the complexity of cross-cultural validation studies and obtain an instrument with recognized psychometric qualities. Although we have limited the literature review to the field of healthcare sciences, the guideline provided also applies to the translation, adaptation, and validation of measurement instruments in other scientific fields. In the future, we recommend researching the impacts of using our practical guideline on researchers’ experience and outcomes when conducting cross-cultural validation studies.

Acknowledgments

We would like to thank the Handovers4SafeCare project of the CIDNUR for leading the development of this study.

Disclosure

The authors report no conflicts of interest in this work.

References

  1. May C, Finch T, Rapley T. Normalization process theory. In: Nielsen P, Birken SA, editors. Handbook of Implementation Science. Edward Elgar Publishing; 2020:157.
  2. Portney LG. Designing surveys and questionnaires. In: Foundations of Clinical Research: Applications to Evidence-Based Practice. 4th ed. F.A. Davis Company; 2020:141-150.
  3. Chow S-C, Liu J-P. Basic statistic concepts. In: Design and Analysis of Clinical Trials. 2nd ed. Wiley-Interscience; 2004:47-54.
  4. Sidani S, Braden CJ. Examination of interventions’ acceptance. In: Nursing and Health Interventions: Design, Evaluation, and Implementation. 2nd ed. Wiley-Blackwell; 2021:218-225.
  5. Efstathiou G. Translation, adaptation and validation process of research intruments. In: Suohnen R, Stolt M, Papatravou E, editors. Individualized Care: Theory, Measurement, Research and Practice. Springer; 2019.
  6. Cha E-S, Kim KH, Erlen JA. Translation of scales in cross-cultural research: issues and techniques. J Adv Nurs. 2007;58(4):386-395. doi:10.1111/j.1365-2648.2007.04242.x
  7. Sutherland S. Outcomes research. In: Gray JR, Grove SK, editors. The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence. 9th ed. Elsevier; 2020:365.
  8. Miller LA, Lovler RL. How do we assess the psychometric quality of a test? In: Foundation of Psychological Testing: A Practical Approach. 6th ed. Sage Publications; 2020:326.
  9. Kristjansson EA, Desrochers A, Zumbo B. Translating and adapting measurement instruments for cross-linguistic and cross-cultural research: a guide for practitioners. Can J Nurs Res. 2003;35(2):127-142.
  10. Alagappan T. The cross-cultural adaptation process of a patient-reported outcome measure. J Sci Soc. 2023;50(1):13. doi:10.4103/jss. jss_136_21
  11. Sul SIR, Lucas PRMB. Translation and validation of the anticipated turnover scale for the Portuguese cultural context. Nurs Open. 2020;7 (5):1475-1481. doi:10.1002/nop2.521
  12. Almeida S, Nascimento A, Lucas PB, Jesus É, Araújo B. RN4CAST study in Portugal: validation of the Portuguese version of the Practice Environment Scale of the Nursing Work Index. Aquichan. 2020;20(3):1-10. doi:10.5294/aqui.2020.20.3.8
  13. Lucas P, Jesus E, Almeida S, Araújo B. Validation of the psychometric properties of the Practice Environment Scale of Nursing Work Index in primary health care in Portugal. Int J Environ Res Public Health. 2021;18(12):6422. doi:10.3390/ijerph18126422
  14. Anunciada S, Benito P, Gaspar F, Lucas P. Validation of psychometric properties of the Nursing Work Index: revised scale in Portugal. Int J Environ Res Public Health. 2022;19(9):4933. doi:10.3390/ijerph 19094933
  15. Carvalho M, Gaspar F, Potra T, Lucas P. Translation, adaptation, and validation of the Self-efficacy scale for clinical nurse leaders for the Portuguese culture. Int J Environ Res Public Health. 2022;19(14):8590. doi:10.3390/ijerph19148590
  16. Sousa E, Lin C-F, Gaspar F, Lucas P. Translation and validation of the indicators of quality nursing work environments in the Portuguese cultural context. Int J Environ Res Public Health. 2022;19(19):12313. doi:10.3390/ijerph191912313
  17. Cabrita C, Lucas P, Teixeira G, Gaspar F. Translation and validation of the Individual Workload Perception Scale: revised for Portuguese nurses. Healthcare. 2022;10(12):2476. doi:10.3390/healthcare10122476
  18. Gomes P, Ribeiro S, Silva M, et al. Cross-cultural validation of the Portuguese version of the Quality of Oncology Nursing Care Scale. Cancers (Basel). 2024;16(5):859. doi:10.3390/cancers16050859
  19. Cunha F, Pinto MR, Riesch S, Lucas P, Almeida S, Vieira M. Translation, adaptation, and validation of the Portuguese version of the Exercise of Self-Care Agency Scale. Healthcare. 2024;12(2):159. doi:10.3390/healthcare12020159
  20. Waltz CF, Strickland OL, Lenz ER. Other mesurement issues. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:446-448.
  21. Beaton D, Bombardier C, Guillemin F, Ferraz MB. Guidelines for the process of cross-cultural adaptation of self-report measures. Spine (Phila Pa 1976). 2000;25(24):3186-3191. doi:10.1097/00007632-200012150-00014
  22. Hedrih V. Test translation. In: Adapting Psychological Tests and Measurement Instruments for Cross-Cultural Research: An Introduction. Routledge; 2020:48-98.
  23. Nord C. Defining translation functions: the translation brief as a guideline for the trainee translator. Ilha Do Desterro. 1997;33:41-55.
  24. Montalt V, González-Davies M. Understanding medical communication. In: Medical Translation Step by Step: Learning by Drafting. Routledge; 2006:47.
  25. Epstein J, Santo RM, Guillemin F. A review of guidelines for cross-cultural adaptation of questionnaires could not bring out a consensus. Clin Epidemiol. 2015;68(4):435-441. doi:10.1016/j.jclinepi.2014.11.021
  26. Herdman M, Fox-Rushby J, Badia X. A model of equivalence in the cultural adaptation of HRQoL instruments: the universalist approach. Qual Life Res. 1998;7(4):323-335. doi:10.1023/a:1024985930536
  27. Peña ED. Lost in translation: methodological considerations in cross-cultural research. Child Dev. 2007;78(4):1255-1264. doi:10.1111/j.14678624.2007.01064.x
  28. Alonso J, Black C, Norregaard J-C, et al. Cross-cultural differences in the reporting of global functional capacity. Med Care. 1998;36 (6):868-878. doi:10.1097/00005650-199806000-00010
  29. Muniz J, Hambleton RK, Xing D. Small samples studies to detect flaws in item translations. Int J Test. 2001;1(2):115-135. doi:10.1207/ S15327574IJT0102_2
  30. Waltz CF, Strickland OL, Lenz ER. Other measurement issues. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:449-452.
  31. Riccio CA, Yoon H, McCormick AS. Neuropsychological test selection with clients who are Asian. In: Davis JM, D’Amato RC, editors. Neuropsychology of Asians and Asian-Americans: Practical and Theoretical Considerations. Spinger Publishing; 2014:153.
  32. Smith TW, et al. Developing and evaluating cross national survey instruments. In: Presser S, Rothgeb JM, Couper MP, editors. Methods for Testing and Evaluating Survey Questionnaires. Wiley Interscience; 2004. 439-442.
  33. van de Vijver F, Portinga YH. Conceptual and methodological issues in adapting tests. In: Hembletom RK, Merenda PF, Spilberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:41-47.
  34. Austin PC, Brunner LJ. Type I error inflation in the presence of a ceiling effect. Am Stat. 2003;57(2):97-104. doi:10.1198/0003130031450
  35. Holbrook A. Acquiescence response bias. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Vol. I. Sage; 2008:3.
  36. van de Vijver FJR, Poortinga YH. Towards an Integrated Analysis of Bias in Cross-Cultural Assessment. Eur J Psychol Assess. 1997; 13 (1):29-37. doi:10.1027/1015-5759.13.1.29
  37. Bartram D. Increasing validity with forced-choice criterion measurement formats. Int J Sel Assess. 2007;15(3):263-272. doi:10.1111/j.14682389.2007.00386.x
  38. Wivagg J. Forced choice. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:289-290.
  39. Maitland A. Attitudes measurement. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:37-38.
  40. Hilton A, Skrutkowski M. Translating instruments into other languages: development and testing processes. Cancer Nurs. 2002;25(1):1-7. doi:10.1097/00002820-200202000-00001
  41. Lino de CR, Brüggemann M, Souza M de L de OM, Barbosa de S, Santos Dos EKA. Adaptação transcultural de instrumentos de pesquisa conduzida pela enfermagem do Brasil: uma revisão integrativa. Texto Context – Enferm. 2018;26(4). doi:10.1590/0104-07072017001730017
  42. Guillemin F, Bombardier C, Beaton D. Cross-cultural adaptation of health-related quality of life measures: literature review and proposed guidelines. J Clin Epidemiol. 1993;46(12):1417-1432. doi:10.1016/0895-4356(93)90142-N
  43. Machado da R, Fernandes AD de BF S, Oliveira de ALCB, Soares LS, Gouveia de O MT, Silva da GRF. Métodos de adaptação transcultural de instrumentos na área da enfermagem. Rev Gaúcha Enferm. 2018;39. doi:10.1590/1983-1447.2018.2017-0164
  44. Acquadro C, Conway K, Hareendran A, Aaronson N. Literature review of methods to translate Health-Related Quality of Life Questionnaires for use in multinational clinical trials. Value Heal. 2008;11(3):509-521. doi:10.1111/j.1524-4733.2007.00292.x
  45. Farina N, Jacobs R, Sani TP, et al. Description of the cross-cultural process adopted in the STRiDE (STrengthening Responses to dementia in DEveloping countries) program: a methodological overview. Alzheimer’s Dement Diagnosis, Assess Dis Monit. 2022;14(1). doi:10.1002/ dad2. 12293
  46. Furukawa R, Driessnack M, Colclough Y. A committee approach maintaining cultural originality in translation. Appl Nurs Res. (2):144-146. doi:10.1016/j.apnr.2013.11.011
  47. Helmich E, Cristancho S, Diachun L, Lingard L. ‘How would you call this in English?’: being reflective about translations in international, cross-cultural qualitative research. Perspect Med Educ. 2017;6(2):127-132. doi:10.1007/S40037-017-0329-1
  48. Uysal-Bozkir Ö, Parlevliet JL, de Rooij SE. Insufficient cross-cultural adaptations and psychometric properties for many translated health assessment scales: a systematic review. J Clin Epidemiol. 2013;66(6):608-618. doi:10.1016/j.jclinepi.2012.12.004
  49. Albach CA, Wagland R, Hunt KJ. Cross-cultural adaptation and measurement properties of generic and cancer-related patient-reported outcome measures (PROMs) for use with cancer patients in Brazil: a systematic review. Qual Life Res. 2018;27(4):857-870. doi:10.1007/s11136-017-1703-5
  50. Praveen S, Parmar J, Chandio N, Arora A. A systematic review of cross-cultural adaptation and psychometric properties of oral health literacy tools. Int J Environ Res Public Health. 2021;18(19):10422. doi:10.3390/ijerph181910422
  51. Min SN, Duangthip D, Gao SS, Detsomboonrat P. Quality of the adaptation procedures and psychometric properties of the scale of oral health outcomes for 5-year-old children (SOHO-5): a systematic review. Qual Life Res. 2023;32(6):1537-1547. doi:10.1007/s11136-022-03280-2
  52. Danielsen AK, Pommergaard H-C, Burcharth J, Angenete E, Rosenberg J. Translation of questionnaires measuring health related quality of life is not standardized: a literature based research study. PLoS One. 2015;10(5):e0127050. doi:10.1371/journal.pone. 0127050
  53. Øygarden A-MU, Berg RC, Abudayya A, Glavin K, Strøm BS. Measurement instruments for parental stress in the postpartum period: a scoping review. PLoS One. 2022;17(3):e0265616. doi:10.1371/journal.pone. 0265616
  54. Echevarría-Guanilo ME, Gonçalves N, Romanoski PJ. Psychometric properties of measurement instruments: conceptual basis and evaluation methods: part II. Texto Context – Enferm. 2019;28(e20170311):1-14. doi:10.1590/1980-265x-tce-2017-0311
  55. Cruchinho P, Teixeira G, Lucas P, Gaspar F. Evaluating the methodological approaches of cross-cultural adaptation of the Bedside Handover Attitudes and Behaviours Questionnaire into Portuguese. J Healthc Leadersh. 2023;15:193-208. doi:10.2147/JHL.S422122
  56. Slade D, Murray KA, Pun JKH, Eggins S. Nurses’ perceptions of mandatory bedside clinical handovers: an Australian hospital study. J Nurs Manag. 2019;27(1):161-171. doi:10.1111/jonm. 12661
  57. Freudental-Pederson M, Hartmann-Peterson K, Nielsen LD. Mixing methods in the search for mobile complexity. In: Ficham B, Mark M, Murray L, editors. Mobile Methodologies. Palgrave McMillan; 2010:30.
  58. Peters M, Passchier J. Translating instruments for cross-cultural studies in headache research. Headache J Head Face Pain. 2006;46(1):82-91. doi:10.1111/j.1526-4610.2006.00298.x
  59. Weeks A, Swerissen H, Belfrage J. Issues, challenges, and solutions in translating study instruments. Eval Rev. 2007;31(2):153-165. doi:10.1177/0193841X06294184
  60. Wild D, Grove A, Martin M, et al. Principles of good practice for the translation and cultural adaptation process for patient-reported outcomes (PRO) measures: report of the ISPOR task force for translation and cultural adaptation. Value Heal. 2005;8(2):94-104. doi:10.1111/j.15244733.2005.04054.x
  61. Reichenheim ME, Moraes CL. Operacionalização de adaptação transcultural de instrumentos de aferição usados em epidemiologia. Rev Saude Publica. 2007;41(4):665-673. doi:10.1590/S0034-89102006005000035
  62. Sousa V, Rojjanasrirat W. Translation, adaptation and validation of instruments or scales for use in cross-cultural health care research: a clear and user-friendly guideline. J Eval Clin Pract. 2011;17(2):268-274. doi:10.1111/j.1365-2753.2010.01434.x
  63. Hagell P, Hedin P-J, Meads DM, Nyberg L, McKenna SP. Effects of Method of Translation of Patient-Reported Health Outcome Questionnaires: a Randomized Study of the Translation of the Rheumatoid Arthritis Quality of Life (RAQoL) Instrument for Sweden. Value Heal. 2010;13(4):424-430. doi:10.1111/j.1524-4733.2009.00677.x
  64. Lee WL, Chinna K, Lim Abdullah K, Zainal Abidin I. The forward-backward and dual-panel translation methods are comparable in producing semantic equivalent versions of a heart quality of life questionnaire. Int J Nurs Pract. 2019;25(1). doi:10.1111/ijn.12715
  65. Papadakis NM, Aletta F, Kang J, Oberman T, Mitchell A, Stavroulakis GE. Translation and cross-cultural adaptation methodology for soundscape attributes – a study with independent translation groups from English to Greek. Appl Acoust. 2022;200:109031. doi:10.1016/j. apacoust.2022.109031
  66. van de Vijver FJR, Poortinga YH. On the study of culture in developmental science. Hum Dev. 2002;45(4):246-256. doi:10.1159/000064985
  67. Petkovic J, Epstein J, Buchbinder R, et al. Toward ensuring health equity: readability and cultural equivalence of OMERACT patient-reported outcome measures. J Rheumatol. 2015;42(12):2448-2459. doi:10.3899/jrheum. 141168
  68. Bundgaard K, Nisbeth Brøgger M. “Don’t fix bad translations”: a netnographic study of translators’ understandings of back translation in the medical domain. MonTi Monogr Traducción e Interpret. 2018;1(10):205-224. doi:10.6035/MonTI.2018.10.8
  69. Hawkins M, Cheng C, Elsworth GR, Osborne RH. Translation method is validity evidence for construct equivalence: analysis of secondary data routinely collected during translations of the Health Literacy Questionnaire (HLQ). BMC Med Res Methodol. 2020;20(1):130. doi:10.1186/ s12874-020-00962-8
  70. Epstein J, Osborne RH, Elsworth GR, Beaton DE, Guillemin F. Cross-cultural adaptation of the Health Education Impact Questionnaire: experimental study showed expert committee, not back-translation, added value. J Clin Epidemiol. 2015;68(4):360-369. doi:10.1016/j. jclinepi.2013.07.013
  71. Teig CJP, Bond MJ, Grotle M, et al. A novel method for the translation and cross-cultural adaptation of health-related quality of life patient-reported outcome measurements. Health Qual Life Outcomes. 2023;21(1):13. doi:10.1186/s12955-023-02089-y
  72. Tsai T-I, Luck L, Jefferies D, Wilkes L. Challenges in adapting a survey: ensuring cross-cultural equivalence. Nurse Res. 2018;26(1):28-32. doi:10.7748/nr.2018.e1581
  73. Jayawickreme E, Jayawickreme N, Goonasekera MA. Using focus group methodology to adapt measurement scales and explore questions of wellbeing and mental health. Intervention. 2012;10(2):156-167. doi:10.1097/WTF.0b013e328356f3c4
  74. Montenegro M, Valdez D, Crawford B, Turner R, Lo W-J, Jozkowski KN. Using a decentering framework to create English/Spanish surveys about abortion: insights into comparative survey research (CSR) for new survey development and recommendations for optimal use. Soc Sci J. 2022;1-15. doi:10.1080/03623319.2022.2092379
  75. Vizcaya-Moreno MF, Pérez-Cañaveras RM. Country validation of the CLES-Scale: linguistic and cultural perspectives. In: Saarikoski M, Strandell-Laine C, editors. The CLES-Scale: An Evaluation Tool for Healthcare Education. Springer; 2018:31-46.
  76. Erkut S. Developing multiple language versions of instruments for intercultural research. Child Dev Perspect. 2010;4(1):19-24. doi:10.1111/ j.1750-8606.2009.00111.x
  77. Marcondes FB, de Vasconcelos RA, Marchetto A, de Andrade ALL, Filho AZ, Etchebehere M. Translation and cross-cultural adaptation of the Rowe score for Portuguese. Acta Ortop Bras. 2012;20(6):346-350. doi:10.1590/S1413-78522012000600007
  78. Nepal GM, Shrestha A, Acharya R. Translation and cross-cultural adaptation of the Nepali version of the Rowland Universal Dementia Assessment Scale (RUDAS). J Patient-Reported Outcomes. 2019;3(1). doi:10.1186/s41687-019-0132-3
  79. Coll-Risco I, Camiletti-Moirón D, Acosta-Manzano P, Aparicio VA. Translation and cross-cultural adaptation of the Pregnancy Physical Activity Questionnaire (PPAQ) into Spanish. J Matern Neonatal Med. 2019;32(23):3954-3961. doi:10.1080/14767058.2018.1479849
  80. Pereira GIDN, Costa CDDS, Geocze L, Borim AA, Ciconelli RM, Camacho-Lobato L. Cross-cultural adaptation and validation for Portuguese (Brazil) of health related quality of life instruments specific for gastroesophageal reflux disease. Arq Gastroenterol. 2007;44(2):168-177. doi:10.1590/s0004-28032007000200016
  81. Grundström H, Rauden A, Olovsson M. Cross-cultural adaptation of the Swedish version of Endometriosis Health Profile-30. J Obstet Gynaecol (Lahore). 2020;40(7):969-973. doi:10.1080/01443615.2019.1676215
  82. Polesello GC, Godoy GF, De Castro Trindade CA, De Queiroz MC, Honda E, Ono NK. Translation and cross-cultural adaptation of the modified Hip outcome tool (mhot) into Portuguese. Acta Ortop Bras. 2012;20(2):88-92. doi:10.1590/S1413-78522012000200006
  83. Muquith MA, Islam MN, Haq SA, Ten Klooster PM, Rasker JJ, Yunus MB. Cross-cultural adaptation and validation of a Bengali version of the modified fibromyalgia impact questionnaire. BMC Musculoskelet Disord. 2012;13(1):1. doi:10.1186/1471-2474-13-157
  84. Toma G, Guetterman TC, Yaqub T, Talaat N, Fetters MD. A systematic approach for accurate translation of instruments: experience with translating the Connor-Davidson Resilience Scale into Arabic. Methodol Innov. 2017;10(3):205979911774140. doi:10.1177/2059799117741406
  85. Poot CC, Meijer E, Fokkema M, Chavannes NH, Osborne RH, Kayser L. Translation, cultural adaptation and validity assessment of the Dutch version of the eHealth Literacy Questionnaire: a mixed-method approach. BMC Public Health. 2023;23(1):1006. doi:10.1186/s12889-023-15869-4
  86. Hasani L, Santoso H, Junus K. Instrument development for investigating students’ intention to participate in online discussion forums: crosscultural and context adaptation sing SEM. J Educ Online. 2021;18(3). doi:10.9743/JEO.2021.18.3.9
  87. Bundgaard K, Brøgger MN. Who is the back translator? An integrative literature review of back translator descriptions in cross-cultural adaptation of research instruments. Perspectives (Montclair). 2019;27(6):833-845. doi:10.1080/0907676X.2018.1544649
  88. Geisinger KF. Cross-cultural normative assessment: translation and adaptation issues influencing the normative interpretation of assessment instruments. Psychol Assess. 1994;6(4):304-312. doi:10.1037/1040-3590.6.4.304
  89. van Widenfelt BM, Treffers PDA, de Beurs E, Siebelink BM, Koudijs E. Translation and cross-cultural adaptation of assessment instruments used in psychological research with children and families. Clin Child Fam Psychol Rev. 2005;8(2):135-147. doi:10.1007/s10567-005-4752-1
  90. Son J. Back translation as a documentation tool. Int J Transl Interpret Res. 2018;10(2):89-100. doi:10.12807/ti.110202.2018.a07
  91. Coster WJ, Mancini MC. Recommendations for translation and cross-cultural adaptation of instruments for occupational therapy research and practice. Rev Ter Ocup da Univ São Paulo. 2015;26(1):50. doi:10.11606/issn.2238-6149.v26i1p50-57
  92. Ortiz-Gutiérrez S, Cruz-Avelar A. Translation and cross-cultural adaptation of health assessment tools. Actas Dermo-Sifiliográficas (English Ed. 2018;109(3):202-206. doi:10.1016/j.adengl.2018.02.003
  93. Ramada-Rodilla JM, Serra-Pujadas C, Delclós-Clanchet GL. Adaptación cultural y validación de cuestionarios de salud: revisión y recomendaciones metodológicas. Salud Publica Mex. 2013;55(1):57-66. doi:10.1590/S0036-36342013000100009
  94. Prakash V, Shah S, Hariohm K. Cross-cultural adaptation of patient-reported outcome measures: a solution or a problem? Ann Phys Rehabil Med. 2019;62(3):174-177. doi:10.1016/j.rehab.2019.01.006
  95. Fortes CPDD, Araújo de QC AP. Check list para tradução e adaptação transcultural de questionários em saúde. Cad Saúde Coletiva. 2019;27 (2):202-209. doi:10.1590/1414-462
  96. Hernández A, Hidalgo MD, Hambleton RK, Gómez-Benito J. International test commission guidelines for test adaptation: a criterion checklist. Psicothema. 2020;32(3):390-398. doi:10.7334/psicothema2019.306
  97. DuBay M, Watson LR. Translation and cultural adaptation of parent-report developmental assessments: improving rigor in methodology. Res Autism Spectr Disord. 2019;62:55-65. doi:10.1016/j.rasd.2019.02.005
  98. Hall DA, Zaragoza Domingo S, Hamdache LZ, et al. A good practice guide for translating and adapting hearing-related questionnaires for different languages and cultures. Int J Audiol. 2018;57(3):161-175. doi:10.1080/14992027.2017.1393565
  99. José M, Elosua P, Hambleton RK. Directrices para la traducción y adaptación de los tests: segunda edición. Psicothema. 2013;25(2):151-157. doi:10.7334/psicothema2013.24
  100. Santo RM, Ribeiro-Ferreira F, Alves MR, Epstein J, Novaes P. Enhancing the cross-cultural adaptation and validation process: linguistic and psychometric testing of the Brazilian-Portuguese version of a self-report measure for dry eye. J Clin Epidemiol. 2015;68(4):370-378. doi:10.1016/j.jclinepi.2014.07.009
  101. Arafat S, Chowdhury H, Qusar M, Hafez M. Cross cultural adaptation and psychometric validation of research instruments: a methodological review. J Behav Heal. 2016;5(3):129. doi:10.5455/jbh.20160615121755
  102. Kyriazos TA. Applied psychometrics: the 3-Faced Construct Validation Method, a routine for evaluating a factor structure. Psychology. 2018;09 (08):2044-2072. doi:10.4236/psych.2018.98117
  103. Plonsky L, Kim Y. Task-based learner production: a substantive and methodological review. Annu Rev Appl Linguist. 2016;36:73-97. doi:10.1017/S0267190516000015
  104. Peters MD, Godfrey C, McInerney P, Soares CB, Khalil H, Parker D. Development of a scoping review protocol. In: Aromataris E, Munn Z, editors. Joanna Briggs Institute Reviewer’s Manual. : The Joanna Briggs Institute; 2020
  105. Shekelle PG, Woolf SH, Eccles M, Grimshaw J. Developing clinical guidelines. West J Med. 1999;170(6):348-351.
  106. OECD Eurostat and World Health Organization. Classification of Health Care Providers (ICHA-HP). In: A System of Health Accounts 2011. OECD Publishing; 2017: 121-152. doi:10.1787/9789264270985-en
  107. Page MJ, McKenzie JE, Bossuyt PM, et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ. 2021: n71. doi:10.1136/bmj.n71
  108. Schreier M. Qualitative content analysis. In: Flick U, editor. The SAGE Handbook of Qualitative Data Analysis. Sage Publications; 2014:170-183.
  109. World Health Organization. Introduction. In: WHO Handbook for Guideline Developement. 2nd ed. World Health Organization; 2014:2
  110. Pernambuco L, Espelt A, Magalhães Junior HV, Lima de KC. Recomendações para elaboração, tradução, adaptação transcultural e processo de validação de testes em fonoaudiologia. CoDAS. 2017;29(3). doi:10.1590/2317-1782/20172016217
  111. International Test Comission. ITC Guidelines for Translating and Adapting Tests. International Test Comission; 2017.
  112. Tafforeau J, Cobo ML, Tolonen H, Christa S-N, Tinto A. Guidelines for the Development and Criteria for the Adoption of Health Survey Instruments; 2015. Available from: https://ec.europa.eu/health/ph_information/dissemination/reporting/healthsurveys_en.pdf. Accessed May 16, 2024.
  113. Høegh MC, Høegh S-M. Trans-adapting outcome measures in rehabilitation: cross-cultural issues. Neuropsychol Rehabil. 2009;19(6):955-970. doi:10.1080/09602010902995986
  114. McKenna SP. Measuring patient-reported outcomes: moving beyond misplaced common sense to hard science. BMC Med. 2011;9(1):86. doi:10.1186/1741-7015-9-86
  115. Prinsen CAC, Mokkink LB, Bouter LM, et al. COSMIN guideline for systematic reviews of patient-reported outcome measures. Qual Life Res. 2018;27(5):1147-1157. doi:10.1007/s11136-018-1798-3
  116. Mokkink LB, Prinsen CAC, Patrick DL, et al. COSMIN Study Design Checklist for Patient-Reported Outcome Measurement Instruments; 2019. Available from: https://www.cosmin.nl/wp-content/uploads/COSMIN-study-designing-checklist_final.pdf. Accessed May 16, 2024.
  117. Gjersing L, Caplehorn JR, Clausen T. Cross-cultural adaptation of research instruments: language, setting, time and statistical considerations. BMC Med Res Methodol. 2010;10(1):13. doi:10.1186/1471-2288-10-13
  118. Chávez LM, Canino GC Toolkit on Translating and Adapting Instruments; 2005. Available from: https://www.hsri.org/files/uploads/publica tions/PN54_Translating_and_Adapting.pdf. Accessed May 16, 2024.
  119. World Health Organization. WHO guidelines on translation: process of translation and adaptation of instruments; 2019. Available from: http:// www.who.int/substance_abuse/research_tools/translation/en/. Accessed May 16, 2024.
  120. Wild D, Eremenco S, Mear I, et al. Multinational trials-Recommendations on the translations required, approaches to using the same language in different countries, and the approaches to support pooling the Data: the ISPOR patient-reported outcomes translation and linguistic validation good research practices task force Report. Value Heal. 2009;12(4):430-440. doi:10.1111/j.1524-4733.2008.00471.x
  121. Swami V, Barron D. Translation and validation of body image instruments: challenges, good practice guidelines, and reporting recommendations for test adaptation. Body Image. 2019;31:204-220. doi:10.1016/j.bodyim.2018.08.014
  122. Kuliś D, Bottomley A, Velikova G, Greimel E, Koller M. EORTC Quality of Life Group Translation Procedure; 2017. Available from: https:// www.eortc.org/app/uploads/sites/2/2018/02/translation_manual_2017.pdf. Accessed May 16, 2024.
  123. Ohrbach R, Ohrbach J, Jezewski M, John MT, Lobbezoo F. Guidelines for Establishing Cultural Equivalency of Instruments; 2013. Available from: https://ubwp.buffalo.edu/rdc-tmdinternational/wp-content/uploads/sites/58/2017/01/Guidelines-for-Translation-and-Cultural-Equivalency-of-Instruments-2013_05_118608.pdf. Accessed May 16, 2024.
  124. Baker DL, Melnikow J, Ying Ly M, Shoultz J, Niederhauser V, Diaz-Escamilla R. Translation of health surveys using mixed methods. J Nurs Scholarsh. 2010;42(4):430-438. doi:10.1111/j.1547-5069.2010.01368.x
  125. Biering-Sørensen F, Alexander MS, Burns S, et al. Recommendations for translation and reliability testing of international spinal cord injury data sets. Spinal Cord. 2011;49(3):357-360. doi:10.1038/sc.2010.153
  126. Koller M, Aaronson NK, Blazeby J, et al. Translation procedures for standardised quality of life questionnaires: the European Organisation for Research and Treatment of Cancer (EORTC) approach. Eur J Cancer. 2007;43(12):1810-1820. doi:10.1016/j.ejca.2007.05.029
  127. Eremenco SL, Cella D, Arnold BJ. A comprehensive method for the translation and cross-cultural validation of health status questionnaires. Eval Health Prof. 2005;28(2):212-232. doi:10.1177/0163278705275342
  128. Dhamani KA, Richter MS. Translation of research instruments: research processes, pitfalls and challenges. Afr J Nurs Midwifery. 2011;13 (1):3-13.
  129. Sperber AD. Translation and validation of study instruments for cross-cultural research. Gastroenterology. 2004;126:S124-S128. doi:10.1053/j. gastro.2003.10.016
  130. Aaronson N, Alonso J, Burnam A, et al. Assessing health status and quality-of-life instruments: attributes and review criteria. Qual Life Res. 2002;11(3):193-205. doi:10.1023/a:1015291021312
  131. Organisation for Economic Co-operation and Development. Translation and adaptation guidelines for PISA 2012; 2012. Available from: https:// www.oecd.org/pisa/pisaproducts/49273486.pdf. Accessed May 16, 2024.
  132. Swami V, Todd J, Barron D. Translation and validation of body image instruments: an addendum to Swami and Barron (2019) in the form of frequently asked questions. Body Image. 2021;37:214-224. doi:10.1016/j.bodyim.2021.03.002
  133. Terwee CB, Prinsen CAC, Chiarotto A, et al. COSMIN methodology for evaluating the content validity of patient-reported outcome measures: a Delphi study. Qual Life Res. 2018;27(5):1159-1170. doi:10.1007/s11136-018-1829-0
  134. Yasir ASM. Cross Cultural Adaptation & Psychometric Validation of Instruments: step-wise Description. Int J Psychiatry. 2016;1(1). doi:10.33140/IJP/01/01/00001
  135. Regnault A, Herdman M. Using quantitative methods within the Universalist model framework to explore the cross-cultural equivalence of patient-reported outcome instruments. Qual Life Res. 2015;24(1):115-124. doi:10.1007/s11136-014-0722-8
  136. Mokkink LB, Terwee CB, Knol DL, et al. The COSMIN checklist for evaluating the methodological quality of studies on measurement properties: a clarification of its content. BMC Med Res Methodol. 2010;10(1):22. doi:10.1186/1471-2288-10-22
  137. Mokkink LB, Terwee CB, Patrick DL, et al. The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study. Qual Life Res. 2010;19(4):539-549. doi:10.1007/s11136-010-9606-8
  138. Terwee CB, Bot SDM, de Boer MR, et al. Quality criteria were proposed for measurement properties of health status questionnaires. Clin Epidemiol. 2007;60(1):34-42. doi:10.1016/j.jclinepi.2006.03.012
  139. Möhler R, Bartoszek G, Köpke S, Meyer G. Proposed criteria for reporting the development and evaluation of complex interventions in healthcare (CReDECI): guideline development. Int Nurs Stud. 2012;49(1):40-46. doi:10.1016/j.ijnurstu.2011.08.003
  140. American Educational Research Association. Standards for Educational and Psychological Testing. American Educational Research Association; 2014.
  141. Gudmundsson E. Guidelines for translating and adapting psychological instruments. Nord Psychol. 2009;61(2):29-45. doi:10.1027/19012276.61.2.29
  142. Forsyth BH, Kudela MS, Levin K, Lawrence D, Willis GB. Methods for translating an English-language survey questionnaire on tobacco use into mandarin, Cantonese, Korean, and Vietnamese. Field Methods. 2007;19(3):264-283. doi:10.1177/1525822X07302105
  143. American Psychological Association. Criteria for practice guideline development and evaluation. Am Psychol. 2002;57(12):1048-1051. doi:10.1037/0003-066X.57.12.1048
  144. Iliescu D. Pre-condition guidelines. In: Adapting Tests in Linguist and Cultural Adaptations. Cambridge University Press; 2017:87.
  145. Iliescu D. Documentation guidelines. In: Adapting Tests in Linguist and Cultural Adaptations. Cambridge University Press; 2017:105.
  146. Hambletom RK. Issues, designs and tecnical guidelines for adaptating tests into multiples languages and cultures. In: Hembletom RK, Merenda PF, Spilberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:3-38.
  147. Oakland T. Selected ethical issues relevant to test adaptations. In: Hambletom RK, Merenda PF, Spielberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates; 2005:80.
  148. Brislin RW, Lonner WJ, Thorndike RM. Cross cultural research methods. In: Transcultural Psychiatric Research Review. Vol. 12. John Wiley ans Sons;1973:7-10. doi:10.1177/136346157501200101
  149. Beaton D, Bombardier C, Guillemin F, Ferraz MB. Recommendations for the cross-cultural adaptation of the DASH & QuickDASH outcome measure. Inst Work Heal. 2007;45.
  150. Ozolins U, Hale S, Cheng X, Hyatt A, Schofield P. Translation and back-translation methodology in health research: a critique. Expert Rev Pharmacoecon Outcomes Res. 2020;20(1):69-77. doi:10.1080/14737167.2020.1734453
  151. Bornman J, Sevcik RA, Romski M, Pae HK. Successfully translating language and culture when adapting assessment measures. J Policy Pract Intellect Disabil. 2010;7(2):111-118. doi:10.1111/j.1741-1130.2010.00254.x
  152. Simonsen E, Mortensen EL. Difficulties in translation of personality scales. J Pers Disord. 1990;4(3):290-296. doi:10.1521/pedi.1990.4.3.290
  153. Tanzer NK. Developing Tests for Use in Multiple Languages and Cultures: A Plea for Simultaneous Development. Lawrence Erlbaum Associates; 2005.
  154. Bennett PM. Reviewing translated scales: backtranslation under the spotlight. Transl Matters. 2022;4(125-144).
  155. van de Vijver F, Tanzer NK. Bias and equivalence in cross-cultural assessment: an overview. Eur Rev Appl Psychol. 2004;54(2):119-135. doi:10.1016/j.erap.2003.12.004
  156. de Klerk S, Jerosch-Herold C, Buchanan H, van Niekerk L. Shared decision making and the practice of community translation in presenting a pre-final Afrikaans for the Western Cape Disabilities of the Arm, Shoulder and Hand (DASH) questionnaire: a proposal for improved translation and cross-cultural adaptation. J Patient-Reported Outcomes. 2019;3(1):52. doi:10.1186/s41687-019-0144-z
  157. Erkut S. Developing multiple language versons of instruments for intercultural research. In: Ji M, editor. Cross-Cultural Health Translation: Exploring Methodological and Digital Tools. Routledge; 2019:9-10.
  158. Silverblatt A, Zlobin N. Production elements. In: International Communications: A Media Literacy Approach. Routledge; 2015:108.
  159. St Amant K. A new web for the new millennium. In: Lipson C, Day M, editors. Technical Communication and the World Wide Web. Lawrence Erlbaum Associates Publishers; 2005:148.
  160. Drasgow F, Probst TM. The psicometrics of adaptation: evaluating measurement equivalance across languages and cultures. In: Hambletom RK, Merenda PF, Spielberg CD, editors. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates Publishers; 2005:361.
  161. Erkut S, Alarcón O, Coll CG, Tropp LR, García HAV. The dual-focus approach to creating bilingual measures. J Cross Cult Psychol. 1999;30 (2):206-218. doi:10.1177/0022022199030002004
  162. van der Vidjer F, Leung K. Equivalence and bias: a review of concepts, models, and data analytic procedures. In: Matsumoto D, van de Vijver F, editors. Cross-Cultural Research Methods in Psychology. Cambridge University Press; 2011:17-44.
  163. American Educational Research Association. Test design and development. Standards for Educational and Psychological Testing; American Educational Research Association; 2014. 81-84.
  164. van Teijlingen ER, Hundley V. Pilot study. In: Lewis-Back MS, Bryman A, Liao TF, editors. The SAGE Encyclopedia of Social Science Research Methods. Vol II. Sage; 2004:823-824.
  165. Gallagher PM. Pretest. In: Lewis-Back MS, Bryman A, Liao TF, editors. The SAGE Encyclopedia of Social Science Research Methods. Vol II. Sage Publications; 2004:853-854.
  166. Korabik K, van Rhijn T. Best practices in scale translation and establisment mesurement equivalence. In: Shockey KM, Shen W, Johnson RC, editors. The Cambridge Handbook of the Global Work-Family Interface. Cambridge University Press; 2018:212-229.
  167. Willis G. Pretesting of health survey questionnaires: cognitive interviewing, usability testing, and behavior coding. In: Johnson TP, editor. Handbook on Health Survey Methods. Willey; 2015:221.
  168. Rodrigues IB, Adachi JD, Beattie KA, MacDermid JC. Development and validation of a new tool to measure the facilitators, barriers and preferences to exercise in people with osteoporosis. BMC Musculoskelet Disord. 2017;18(1):540. doi:10.1186/s12891-017-1914-5
  169. Perneger TV, Courvoisier DS, Hudelson PM, Gayet-Ageron A. Sample size for pre-tests of questionnaires. Qual Life Res. 2015;24(1):147-151. doi:10.1007/s11136-014-0752-2
  170. Holyk GG. Question testing methods. In: Encyclopedia of Survey Research Methods. Vol II. Sage; 2008:658-659.
  171. van der Zouwen J, Smit JH, et al. Evaluating survey questions by analyzing patterns of behavior codes and question-answer sequences: a diagnostic approach. In: Presser S, Rothgeb JM, Couper MP, editors. Methods for Testing and Evaluating Survey Questionnaires. Wiley Interscience; 2004. 124.
  172. Wynd CA, Schmidt B, Schaefer MA. Two quantitative approaches for estimating content validity. West J Nurs Res. 2003;25(5):508-518. doi:10.1177/0193945903252998
  173. Polit DF, Beck CT. Measurement and data quality. In: Nursing Research: Generating and Assessing Evidence for Nursing Practice. 9th ed. Wolker Klumer / Lippincott Williams & Wilkins; 2012:334.
  174. Linden B, Stuart H. Preliminary analysis of validation evidence for two new scales assessing teachers’ confidence and worries related to delivering mental health content in the classroom. BMC Psychol. 2019;7(1):32. doi:10.1186/s40359-019-0307-y
  175. Rubio DM, Berg-Weger M, Tebb SS, Lee ES, Rauch S. Objectifying content validity: conducting a content validity study in social work research. Soc Work Res. 2003;27(2):94-104. doi:10.1093/swr/27.2.94
  176. Almanasreh E, Moles R, Chen TF. Evaluation of methods used for estimating content validity. Res Soc Adm Pharm. 2019;15(2):214-221. doi:10.1016/j.sapharm.2018.03.066
  177. DesRoches D. Establishment survey. In: Lavrakas PJ, editor. Encyclopedia of Survey Research Methods. Sage; 2008:124.
  178. Kelly J, Lavrakas PJ. Debriefing. In: Encyclopedia of Survey Research Methods. Vol I. Sage; 2008:181-182.
  179. Beatty P. Developing measures of health behavior and he alth service utilization. In: Johnson TP, editor. Handbook on Health Survey Methods. Willey; 2015:186-187.
  180. Polit DF, Beck CT, Owen SV. Is the CVI an acceptable indicator of content validity? Appraisal and recommendations. Res Nurs Health. 2007;30 (4):459-467. doi:10.1002/nur. 20199
  181. Yusoff MSB. ABC of content validation and content validity index calculation. Educ Med J. 2019;11(2):49-54. doi:10.21315/eimj2019.11.2.6
  182. Polit DF, Beck CT. Qualitative research design and approaches. In: Nursing Research: Generating and Assessing Evidence for Nursing Practice. 10th ed. Wolters Kluwer; 2017:489.
  183. Lawshe CH. A quantitative approach to content validity. Pers Psychol. 1975;28(4):563-575. doi:10.1111/j.1744-6570.1975.tb01393.x
  184. Ayre C, Scally AJ. Critical values for Lawshe’s Content Validity Ratio. Meas Eval Couns Dev. 2014;47(1):79-86. doi:10.1177/ 0748175613513808
  185. Stone KS, Frazier SK. Evaluation of measurement precision, accuracy, and error in biophysical data. In: Waltz CF, Strickland OL, Lenz ER, editors. Measurement in Nursing and Health Research. 4th ed. Springer Publishing; 2010:387-390.
  186. Cicchetti DV. On a model for assessing the security of infantile attachment: issues of observer reliability and validity. Behav Brain Sci. 1984;7 (1):149-150. doi:10.1017/S0140525X00026558
  187. Fleiss JL. Measuring nominal scale agreement among many raters. Psychol Bull. 1971;76(5):378-382. doi:10.1037/h0031619
  188. Kottner J, Audige L, Brorson S, et al. Guidelines for reporting reliability and agreement studies (GRRAS) were proposed. Int J Nurs Stud. 2011;48(6):661-671. doi:10.1016/j.ijnurstu.2011.01.016
  189. Osborne JW. Best Practices in Exploratory Factor Analysis. CreateSpace Independent Publishing; 2014.
  190. Lloret-Segura S, Ferreres-Traver A, Hernández-Baeza A, Tomás-Marco I. El análisis factorial exploratorio de los ítems: una guía práctica, revisada y actualizada. An Psicol. 2014;30(3). doi:10.6018/analesps.30.3.199361
  191. Field A. Why is my evil lecturer forcing me to learn statistics? In: Discovering Statistics Using IBM SPSS Statistics. 5th ed. Sage Publications; 2018:70-71.
  192. Kothari CR. Multivariate analysis techniques. In: Research Methodology: Methods and Techniques. 2nd ed. New Age Publisher; 2004:322.
  193. Haig BD. Exploratory factor analysis, theory generation, and scientific method. In: Method Matters in Psychology: Essays in Applied Philosophy of Science. Springer; 2018:65-88.
  194. Haig BD. Exploratory factor analysis, theory generation, and scientific method. Multivariate Behav Res. 2005;40(3):303-329. doi:10.1207/ s15327906mbr4003_2
  195. Råholm M-B. Abductive reasoning and the formation of scientific knowledge within nursing research. Nurs Philos. 2010;11(4):260-270. doi:10.1111/j.1466-769X.2010.00457.x
  196. Prudon P. Confirmatory factor analysis as a tool in research using questionnaires: a critique. Compr Psychol. 2015;4:03.CP.4.10. doi:10.2466/ 03.CP.4.10
  197. Eldridge J. Reliability, validity and trustworthiness. In: Boswell C, Cannon S, editors. Introduction to Nursing Research: Incorporating Evidence-Based Practice. 5th ed. Jones & Bartlettt Publishers; 2020:271-294.
  198. Abu-Bader SH. Working with SPSS. In: Using Statistical Methods in Social Science Research: With a Complete SPS Guide. 2nd ed. Oxford University Press; 2021:56.
  199. Perrin KM. Reliability and validity. In: Principles of Planning, Evaluation and Research for Health Care Programmes. 2nd ed. Jones &: Bartlett Learning; 2022:141.
  200. Grove SK. Quantitative measurement concepts. In: Gray JR, Grove SK, editors. Burns & Groves the Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence. 9th ed. Elsevier; 2021:462.
  201. Hair J, Hollingsworth CL, Randolph AB, Chong AYL. An updated and expanded assessment of PLS-SEM in information systems research. Ind Manag Data Syst. 2017;117(3):442-458. doi:10.1108/IMDS-04-2016-0130
  202. Field A. Exploratory factor analysis. In: Discovering Statistics Using IBM SPSS Statistics (North American Edition). 5th ed. Sage; 2018:1390-1391.
  203. Clark LA, Watson D. Constructing validity: new developments in creating objective measuring instruments. Psychol Assess. 2019;31 (12):1412-1427. doi:10.1037/pas0000626
  204. Moreira J. Questionários: Teoria e Prática. Almedina; 2004.
  205. Streiner DL, Norman GR, Cainey J. Basic concepts. In: Health Measurement Scales: A Practical Guide to Their Development and Use. 5th ed. Oxford University Press; 2015:8.
  206. Bryant F. Assessing the validity of measurement. In: Grimm LG, Yarnold PR, editors. Reading and Understanding More Multivariate Statistics. American Psychological Association; 2002:99-146.
  207. Marôco J, Etapas da análise de equações estruturais. 3rd. Análise de Equações Estruturais, 2021:55
  208. Sommer I, Larsen K, Nielsen CM, Stenholt BV, Bjørk IT. Improving clinical nurses’ development of supervision skills through an action learning approach. Nurs Res Pract. 2020;2020:1-10. doi:10.1155/2020/9483549
  209. Bowling A. Quality of life: concepts, measurements and patient perception. In: Research Methods in Health: Investigating Health and Health Services. 4th ed. Open University Press; 2014:54.
  210. Bot SM, Terwee CB, van der Windt DAWM, Boute LM, Dekker J, Vet de HCW. Psychometric evaluation of self-report questionnaires: the development of a checklist. In: Adér HJ, Mellenberg C, editors. Proceedings of the Second Workshop on Research Methodology. Vu University; 2003:161-168.
  211. Powers BA, Knapp TR. Face validity. In: Dictionary of Nursing Theory and Research. 3rd ed. Spinger Publishing; 2006:63.
  212. Soeken WKL. Validity of measures. In: Measurement in Nursing and Health Research. 4th ed. Springer Publishing Company; 2010:163.
  213. Streiner DL, Norman GR, Cairney J. Seleting the itens. In: Health Measurement Scales: A Practical Guide to Their Development and Use. 5th. Oxford University Press; 2015:92.
  214. Zumbo BD. Validity as contextualized and pragmatic explanation, and its implications for validation practice. In: Lissitz RW, editor. The Concept of Validity: Revisions, New Directions, and Applications. Information Age Publishing; 2009:68.
  215. Chan EKH. Standards and guidelines for validation practices: development and evaluation of measurement instruments. In: Zumbo BD, Chan EKH, editors. Validity and Validation in Social, Behavioral, and Health Sciences. Springer Publishing; 2014:9-24.
  216. Mokkink LB, Terwee CB, Knol DL, et al. Taxonomy and definitions. COSMIN Checklist Manual. 2012;9.
Journal of Multidisciplinary Healthcare

Publish your work in this journal

The Journal of Multidisciplinary Healthcare is an international, peer-reviewed open-access journal that aims to represent and publish research in healthcare areas delivered by practitioners of different disciplines. This includes studies and reviews conducted by multidisciplinary teams as well as research which evaluates the results or conduct of such teams or healthcare processes in general. The journal covers a very wide range of areas and welcomes submissions from practitioners at all levels, from all over the world. The manuscript management system is completely online and includes a very quick and fair peer-review system. Visit http://www.dovepress.com/testimonials.php to read real quotes from published authors.