تبسيط منهجية البحث: كيفية اختيار تقنية العينة المناسبة وتحديد حجم العينة الملائم للبحث Research Methodology Simplified: How to Choose the Right Sampling Technique and Determine the Appropriate Sample Size for Research

المجلة: Oral Oncology Reports، المجلد: 12
DOI: https://doi.org/10.1016/j.oor.2024.100662
تاريخ النشر: 2024-09-26

تبسيط منهجية البحث: كيفية اختيار تقنية العينة المناسبة وتحديد حجم العينة الملائم للبحث

سيروان خالد أحمد وزارة الصحة، المديرية العامة للصحة في رابرين، رانيا، السليمانية، إقليم كردستان، 46012، العراق كلية التمريض، جامعة رابرين، رانيا، السليمانية، إقليم كردستان، 46012، العراق

معلومات المقال

الكلمات المفتاحية:

أخذ العينات
حجم العينة
تقنية أخذ العينات
حسابات حجم العينة
جدول حجم العينة
عملية أخذ العينات
أخذ العينات الاحتمالية
أخذ العينات غير الاحتمالية
البحث الكمي
مستوى الثقة
هامش الخطأ
حجم السكان
حجم التأثير
الصلاحية
الموثوقية
البحث الاستقصائي
تصميم الدراسة

الملخص

تتطلب تقنية أخذ العينات المناسبة مع التحديد الدقيق لحجم العينة عملية اختيار دقيقة للغاية، وهي في الواقع حيوية لأي بحث تجريبي. من الواضح أن هذه القرارات المنهجية ستؤثر بشكل كبير على الصلاحية الداخلية والخارجية وقابلية تعميم نتائج الدراسة بشكل عام. لقد قامت هذه الورقة بتحديث شامل للإرشادات حول طرق أخذ العينات وحساب حجم العينة، مما يوفر أدلة كافية ستكون مفيدة في مساعدة الباحثين على تعزيز مصداقية وقوة البحث الإحصائية. تم شرح الفروق بين تقنيات أخذ العينات الاحتمالية، بما في ذلك أخذ العينات العشوائية البسيطة، وأخذ العينات الطبقية، وأخذ العينات العنقودية، وطرق أخذ العينات غير الاحتمالية، مثل أخذ العينات المريحة، وأخذ العينات الهادفة، وأخذ العينات الثلجية، بشكل كامل. الاحتمالية هي الوحيدة التي يمكن أن تضمن قابلية التعميم، بينما تعتبر أخذ العينات غير الاحتمالية مفيدة في الحالات الاستكشافية. عملية أخرى مهمة هي تحديد حجم العينة الأمثل، والذي يجب أن يأخذ في الاعتبار، من بين أمور أخرى، الحجم الإجمالي للسكان، وحجم التأثير، والقوة الإحصائية، ومستوى الثقة، وهامش الخطأ. تسهم الورقة في تقديم إرشادات نظرية وأدوات عملية يحتاجها الباحثون في اختيار استراتيجيات مناسبة لأخذ العينات والتحقق من حسابات حجم العينة المناسبة منهجياً. باختصار، تحدد مثل هذه الورقة المعايير لأفضل الممارسات في منهجية البحث التي ستعزز الموثوقية والصلاحية والصرامة التجريبية عبر دراسات متنوعة.

1. المقدمة

ستكون الدراسة التجريبية دقيقة وصحيحة عندما يتم اختيار تقنية العينة المناسبة بعناية. تتضمن تقنية أخذ العينات اختيار مجموعة فرعية من السكان الأكبر وهي جوهر البحث، حيث تعتمد طبيعة وقابلية تعميم النتائج على ذلك [1]. يعتمد نجاح أي دراسة على ملاءمة طريقة أخذ العينات.
تستند مبررات منهجيات أخذ العينات إلى قدرة هذه الإجراءات على استنتاج خصائص حول السكان دون التوقع غير الواقعي المتأصل في تقييم مجموعة كاملة. هذا مهم وضروري جداً في الحالات التي يصبح فيها التعداد الكامل مستحيلاً لسكان معينين بسبب قضايا تشغيلية مثل الوقت، والموارد، أو قيود الوصول. ستلتقط العينة المختارة بشكل صحيح وتعزز الصلاحية الخارجية وقابلية تعميم النتائج [2].
تقسم بشكل عام إلى قسمين: الاحتمالية وغير الاحتمالية
أخذ العينات [1،3]. تشمل أخذ العينات الاحتمالية أخذ العينات العشوائية الأساسية، وأخذ العينات الطبقية، وأخذ العينات العنقودية، حيث تعتمد طرق الاختيار على عملية العشوائية كعملية تعزيز لتقليل التحيز في الاختيار. تتمتع هذه الطرق بمبادئ إحصائية سليمة وعادة ما يتم اعتمادها عندما يكون الهدف هو التعميم. تشمل طرق أخذ العينات غير الاحتمالية أخذ العينات المريحة وأخذ العينات الهادفة كلما لم يكن الاختيار العشوائي ممكنًا أو عمليًا. قد تكون هذه مريحة لأغراض عملية، لكنها ستؤدي بسرعة إلى تحيزات في العينة التي ستؤثر بعد ذلك على تعميم النتائج [4].
يرتبط اختيار طريقة أخذ العينات ارتباطًا وثيقًا ببعض الأهداف البحثية المحددة، وبعض الخصائص الديموغرافية للسكان المستهدفين، وبعض القيود المنهجية للدراسة. يرتبط الاختيار الصحيح لتقنية أخذ العينات ارتباطًا كبيرًا بالصلاحية وقابلية تعميم نتائج الدراسة. يتطلب ذلك معرفة واسعة بإجراءات أخذ العينات المختلفة وعواقبها من جانب الباحث الذي ينوي أن يكون صحيحًا منهجيًا.
حاولت المقالة مناقشة مختلف الأساليب لأخذ العينات في
منهجية البحث، وتحديد حسابات حجم العينة الأكثر ملاءمة حتى يتمكن الباحث من اختيار الأنسب لوضع بحث معين. ستسعى هذه الورقة إلى إلقاء نظرة قريبة على مزايا وعيوب الإجراءات المختلفة لأخذ العينات في تعزيز أفضل ممارسات البحث وتعزيز الصلاحية التجريبية.

2. عملية أخذ العينات في البحث

تعتبر عملية أخذ العينات واحدة من أهم أجزاء منهجية البحث، والتي من خلالها يتم ضمان دقة وصلاحية النتائج من الدراسة [5]. تبدأ هذه العملية بتحديد السكان المستهدفين، الذين يمكن أن يكونوا مجموعة كاملة من الأشخاص أو الكيانات المتعلقة بسؤال البحث. من المهم جدًا تحديد بوضوح ودقة ما يشكل السكان للتأكد من أن العينة تصف المجموعة قيد الدراسة. يعني السكان التعريف الذي يجب أن يعكس سمة مثل المتغيرات الديموغرافية، والموقع الجغرافي، وأي سمة أخرى قد تكون ذات صلة بالبحث.
بعد تحديد السكان، تكون العملية التالية هي اختيار طريقة أخذ عينات مناسبة. نظرًا لأهداف البحث والموارد والحاجة إلى التعميم، يجب على الباحثين الاختيار بين طرق أخذ العينات الاحتمالية وغير الاحتمالية. عادةً ما تشمل مبررات التفضيل، إذا كان الهدف هو إجراء استنتاجات حول السكان، الطرق التالية لأخذ العينات الاحتمالية: أخذ العينات العشوائية البسيطة، وأخذ العينات الطبقية، وأخذ العينات العنقودية، وأخذ العينات النظامية. تعتبر أخذ العينات المريحة، وأخذ العينات الهادفة، وأخذ العينات الثلجية بعض الطرق التي يتم اعتمادها عادةً في طرق أخذ العينات غير الاحتمالية للدراسات الاستكشافية أو عندما لا يكون السكان متاحين.
بمجرد تنفيذ اختيار خطة أخذ العينات، يجب على الباحث تحديد حجم هذه العينة، ويعتبر ذلك أمرًا حيويًا لموثوقية النتائج. عند حساب حجم العينة، قد تكون عدة عوامل مهمة: حجم السكان، وحجم التأثير المتوقع، ومستوى الثقة، وهامش الخطأ. يمكن تحقيق ذلك بمساعدة تقنيات أو أدوات إحصائية لتجنب الحصول على عينة صغيرة جدًا قد تؤدي إلى نتائج غير موثوقة، أو كبيرة جدًا حيث سيتم إهدار الموارد.
يشير اختيار أخذ العينات إلى المرحلة التي ستحدد فيها طريقة أخذ العينات المختارة من يجب أن يشكل دراسة في السكان. يمكن القيام بذلك من خلال توليد أرقام عشوائية أو طرق اختيار منهجية في حالة أخذ العينات الاحتمالية. في أخذ العينات غير الاحتمالية، قد يتعلق الأمر بالحالات القابلة للوصول أو الحالات المحددة ذات الصلة بالدراسة المعنية.
أخيرًا، يجب على الباحث تحليل البيانات المستمدة من العينة، مع الأخذ في الاعتبار أنه لا يمكن استخلاص أي استنتاج إذا لم يتم النظر في إجراء أخذ العينات. بعبارة أخرى، يجب أن يكون في الاعتبار مدى تحيز العينة، أو أين تكمن القيود وما إذا كان التعميم على السكان بأكمله ممكنًا. ستساعد خطة أخذ عينات رسمية الباحث في تعزيز صلاحية وموثوقية النتائج، وبالتالي دقة وموضوعية استنتاجاته. يتم تقديم خطوات عملية أخذ العينات في الشكل 1.

3. تقنيات أخذ العينات

التمييز بين العينة العشوائية والعينة غير العشوائية هو استراتيجيتان مختلفتان تعتمد عليهما الأبحاث لاختيار المشاركين [6]. لكل منهما مزايا وعيوب خاصة بها. تضمن العينة العشوائية أن كل موضوع من السكان يحمل احتمالًا معروفًا وغير صفري للاختيار. يقلل العشوائية في هذا التصميم من التحيز في الاختيار ويجعل العينة تمثل السكان ككل. توفر العينة العشوائية للباحث فرصة لإجراء تعميمات من العينة إلى السكان وتقدير خطأ العينة بمقياس من الثقة. تشمل أمثلة التقنيات التي تندرج تحت هذه الفئة العينة العشوائية البسيطة، والعينة الطبقية، وعينة المجموعات. بينما تكون العينة العشوائية دقيقة، إلا أنها تميل إلى أن تكون
الشكل 1. خطوات عملية أخذ العينات.
مرهقة وتتطلب الكثير من الوقت والموارد، خاصة عندما يكون عدد السكان المستهدف كبيرًا جدًا أو متشتتًا، حيث إنها تعتمد على قائمة مفصلة بالسكان ويجب أن يتم الاختيار باستخدام إجراء معقد.
على العكس، تشمل العينة غير العشوائية عدم وجود عشوائية؛ لذلك، لا يحمل جميع الموضوعات في السكان احتمالًا متساويًا أو معروفًا للاختيار. يُستخدم هذا بشكل أساسي عندما لا يكون من الممكن للباحثين الوصول إلى جميع السكان أو عندما تكون الموارد والوقت محدودة. تشمل بعض طرق أخذ العينات غير العشوائية أخذ العينات المريحة، وأخذ العينات الهادفة، وأخذ العينات المتساقطة، حيث يعتمد الأمر على حكم الباحث أو توفر المشاركين. هذه الطريقة الأخيرة، على الرغم من كونها أسرع وأقل تكلفة وأسهل في التنفيذ، تحمل خطر التحيز في الاختيار – أي أن العينة المختارة قد تحتوي في النهاية على تمثيل زائد أو ناقص لمجموعات. لذلك، فإن نتائج أخذ العينات غير العشوائية لها عمومًا قابلية تعميم محدودة على السكان بشكل عام، ولا يمكن إجراء الاستدلال الإحصائي بثقة. ومع ذلك، فهي مفيدة جدًا في الأبحاث الاستكشافية والدراسات النوعية، حيث يكون الهدف هو دراسة بعض تلك المجموعات الفرعية التي يصعب الوصول إليها بدلاً من تمثيل السكان ككل.
عندما تتطلب حالة البحث درجة عالية من الدقة والتعميم للنتائج على السكان ككل، يُفضل استخدام العينة العشوائية. فقط في الدراسات الصغيرة أو الاستكشافية يمكن للمرء اللجوء إلى العينة غير العشوائية عندما تكون القيود اللوجستية أو مجموعات التركيز أكثر أهمية من التمثيل. لكل من التقنيتين مكان في البحث، لكن اختيار واحدة أو أخرى يعتمد على أهداف البحث والموارد والاحتياجات المتعلقة بالموثوقية الإحصائية. يلخص الشكل 2 والجدول 1 تقنيات أخذ العينات العشوائية وغير العشوائية بالتفصيل، مع عدد من المزايا والعيوب المرتبطة بكل تقنية. يجب أن يكون هذا مفيدًا في تمكين الباحث من اختيار
الشكل 2. تقنيات أخذ العينات في البحث.
طريقة أخذ العينات الأنسب لدراساته.

3.1. طرق أخذ العينات العشوائية

3.1.1. العينة العشوائية البسيطة

العينة العشوائية البسيطة، على الرغم من كونها أساسية جدًا، هي طريقة فعالة لضمان أن كل عضو من السكان سيكون له فرصة للاختيار. بعد تعريف وتجميع قائمة كاملة من الأعضاء الذين يشكلون السكان، يتم تحديد حجم العينة، ثم يبدأ الاختيار العشوائي الفعلي باستخدام مولد أرقام عشوائية أو سحب القرعة. هذه الطريقة ذات قيمة عالية لأنها تقلل من التحيز في الاختيار، على الرغم من أنها قد تكون متطلبة جدًا من حيث اللوجستيات، خاصة عندما يكون عدد السكان كبيرًا أو متشتتًا.

3.1.2. أخذ العينات الطبقية

في أخذ العينات الطبقية، يتم تقسيم السكان إلى مجموعات متميزة، تُعرف عادةً بالطبقات، بناءً على فئات موحدة مثل العمر أو الجنس أو التعليم. ثم يتم أخذ عينات عشوائية من كل طبقة لاشتقاق عينة تمثل النطاق الكامل من الفئات. سيزيد هذا من دقة التقديرات، نظرًا لأن كل مجموعة فرعية ممثلة بشكل جيد، مما يجعل هذه الطريقة أكثر ملاءمة للسكان حيث توجد تباينات كبيرة في الخصائص الرئيسية. ومع ذلك، من الصعب تشكيل الطبقات بشكل ذي معنى إذا لم يكن هناك معرفة تفصيلية بالسكان.

3.1.3. أخذ العينات العنقودية

أخذ العينات العنقودية هي طريقة لتبسيط عملية جمع البيانات حيث يتم تقسيم السكان إلى عنقود، قد تكون مواقع جغرافية أو مؤسسات، ويتم أخذ اختيار عشوائي من هذه للدراسة. سيتم تضمين جميع الأعضاء في العناقيد المختارة في العينة. ستكون هذه الطريقة مفيدة جدًا في الدراسات الكبيرة حيث سيكون من غير العملي تجميع قائمة كاملة من السكان. على الرغم من أن أخذ العينات العنقودية غير مكلف، إلا أنه قد يقدم تحيزات إذا كانت العناقيد المختارة ليست نموذجية للسكان بشكل عام.

3.1.4. أخذ العينات النظامية

في أخذ العينات النظامية، يتم اختيار كل فرد بطريقة مستمرة من قائمة السكان، بدءًا من نقطة عشوائية. إنها فعالة وسهلة التنفيذ إلى حد ما لأنها تعتمد على فترة أخذ عينات منتظمة. قد تكون أخذ العينات النظامية متحيزة، ومع ذلك، إذا كان هناك نمط متأصل في السكان يتزامن مع فترة أخذ العينات.

3.1.5. أخذ العينات متعددة المراحل

في أخذ العينات متعددة المراحل، يتم تقسيم السكان إلى عدد من المراحل أو المستويات. على سبيل المثال، في أخذ العينات العنقودية – شكل معقد من
أخذ العينات متعددة المراحل – يتم تقسيم السكان إلى عناقيد كبيرة (على سبيل المثال، مناطق أو مؤسسات)، يتم منها سحب عينات عشوائية إضافية في مراحل متعاقبة. بمجرد اختيار المناطق الجغرافية، على سبيل المثال، يمكن اختيار عينة عشوائية من الأفراد داخل كل منطقة. تعتبر الطبقات المتدرجة مفيدة في الدراسات الكبيرة لتقليل حجم العينة بشكل منهجي من خلال تضييق نطاق السكان الواسع أو المتشتت. بينما قد يوفر ذلك التكاليف والوقت، هناك خطر زيادة خطأ العينة في كل مرحلة من عملية الاختيار، إذا لم تكن العينة في كل مستوى تمثل.

3.2. طرق أخذ العينات غير العشوائية

3.2.1. أخذ العينات المريحة

من بين الطرق المختلفة لجمع البيانات، تتضمن أخذ العينات المريحة سحب عينات من تلك الجزء من السكان الذي يجد الباحث أنه الأكثر وصولًا [2]. هذه طريقة سريعة ورخيصة لجمع البيانات عندما يكون الوقت أو الموارد محدودة. ومع ذلك، في معظم الحالات، تقدم هذه الطريقة تحيزًا، حيث قد لا تكون العينة تمثيلية وبالتالي لن يكون من الممكن تعميم النتائج على بقية السكان.

3.2.2. أخذ العينات الهادفة

في أخذ العينات الهادفة، المعروف أيضًا بأخذ العينات الحكمية أو الخبيرة، يتم اختيار المشاركين بناءً على حكم الباحث الذي يقرر من سيكون الأكثر فائدة للبيانات المطلوبة [2]. يُستخدم هذا عادةً في الأبحاث التي تتطلب أشخاصًا معينين يتمتعون بخصائص أو خبرات محددة. على الرغم من أن هذه الطريقة يمكن أن تؤدي إلى رؤى عميقة جدًا، إلا أنها تحمل خطرًا عاليًا جدًا من التحيز من جانب الباحث وقد لا تمثل السكان ككل.

3.2.3. أخذ العينات المتساقطة

تُستخدم أخذ العينات المتساقطة عندما يتم دراسة السكان المخفيين أو صعب الوصول إليهم. في هذه الحالة، يُطلب من المشاركين إحالة أولئك الذين يتناسبون أيضًا مع معايير المشاركين في الدراسة، مما يجعل شبكة من الإحالات. هذه التقنية مفيدة في الأبحاث الاستكشافية. ومع ذلك، تم انتقادها لأنها تؤدي إلى عينات متحيزة لأن العينات تصبح متجانسة مع مرور الوقت بسبب الشبكات الاجتماعية.

3.2.4. أخذ العينات الحصصية

تشير أخذ العينات الحصصية إلى العملية التي يتم من خلالها تقسيم السكان إلى مجموعات فرعية متبادلة حصرية يتم من خلالها اختيار المشاركين، مما يضمن ملء حصص معينة داخل كل مجموعة فرعية. تضمن الحصص وجود خصائص معينة من السكان داخل العينة؛ ومع ذلك، يبقى الاختيار الفعلي داخل المجموعة الفرعية غير عشوائي، وبالتالي متحيز وعينة أقل تمثيلاً.
الجدول 1
الإيجابيات والسلبيات لتقنيات أخذ العينات العشوائية وغير العشوائية.
تقنيات أخذ العينات الإيجابيات السلبيات
أخذ العينات العشوائية البسيطة
1 يجعل العملية عادلة لكل شخص ليكون لديه فرصة متساوية للاختيار دون أي تحيز.
2 من السهل إجراء اختبارات إحصائية عليها بسبب طبيعتها العشوائية.
3 من غير المرجح أن يحدث تحيز الاختيار، مع نتائج أكثر موثوقية وقابلية للتعميم.
1 يتطلب عدًا كاملاً ودقيقًا للسكان، وهو ما قد يكون صعبًا الحصول عليه، خاصة في السكان الكبار أو المختلطين.
2 يمكن أن يصبح مكلفًا من حيث الموارد ويستغرق وقتًا طويلاً، خاصة في حالة السكان الكبار.
3 ما لم يكن حجم العينة كبيرًا بما فيه الكفاية، فلن تلتقط العشوائية المجموعات الفرعية النادرة.
العينة المنهجية
1 الطريقة أسهل في التطبيق من العينة العشوائية البسيطة في السكان الكبار.
2 يتم الاختيار بطريقة منظمة، مما يساعد في التنظيم.
3 بشكل عام، أكثر فعالية من العينة العشوائية البسيطة من حيث الوقت والموارد.
1 قد يجلب تحيزًا إذا تزامن النمط الدوري في قائمة السكان مع الفاصل الزمني المستخدم لأخذ العينات، مما يؤدي إلى تمثيل زائد أو ناقص لخصائص معينة.
2 أقل عشوائية من العينة العشوائية البسيطة، وبالتالي يمكن أن يقلل من تنوع العينة.
العينة الطبقية
1 يضمن تمثيل المجموعات الفرعية الرئيسية، أو الطبقات، مما يؤدي إلى تقديرات أكثر دقة وملاءمة.
2 يضمن زيادة الكفاءة الإحصائية وتقليل التباين داخل الطبقات، مما يزيد من موثوقيتها.
3 يمكن أن يعزز القابلية للمقارنة بين الطبقات المختلفة للسماح برؤية مركزة.
1 في تشكيل الطبقات، هناك حاجة إلى معرفة تفصيلية بخصائص السكان، والتي قد لا تكون متاحة.
2 أكثر تعقيدًا في التنفيذ والتفسير من الطرق المباشرة، ويتطلب تفكيرًا متقدمًا أكثر.
العينة العنقودية
1 غير مكلفة وفعالة للسكان المتناثرين جغرافيًا لتقليل التكاليف المرتبطة بالسفر.
2 توفر الموارد والوقت لجمع البيانات؛ وبالتالي، تجعل الدراسات الكبيرة ممكنة.
3 مفيدة في الحالات التي لا تتوفر فيها القائمة الكاملة للسكان وعندما تكون المعلومات العنقودية فقط مطلوبة.
1 قد لا تكون العنقوديات متجانسة، وهذا قد يزيد من تباين العنقوديات ويشوه النتائج.
2 يمكن أن تكون التحليلات صعبة حيث تكون العنقوديات غير محددة بشكل جيد أو تختلف بشكل كبير.
العينة المريحة
1 جمع البيانات سريع ورخيص؛ وبالتالي، يمكن الحصول على النتائج في فترة زمنية قصيرة جدًا.
2 مفيدة في الدراسات الأولية أو كاختبار تجريبي عندما تكون الموارد/الوقت شحيحة.
3 نسبيًا سهلة التنفيذ، خاصة في البيئات المألوفة مثل المستشفيات أو مراكز المجتمع.
1 هناك خطر كبير من تحيز الاختيار، مما يعني أن النتائج لا يمكن تعميمها عبر السكان بأكمله بسبب ضعف الصلاحية الخارجية.
2 قد تعكس فقط تجارب أو آراء مجموعة معينة وبالتالي تعطي نتائج متحيزة.
العينة الهادفة
1 يمكن دراسة القضايا والسكان ذات الصلة بشكل خاص بسؤال البحث بعمق أكبر.
2 مناسبة للبحث النوعي، خاصة في الحالات التي تكون فيها معلومات معينة حول التجارب أو الخبرة مطلوبة.
3 يسمح بجمع البيانات مع التركيز على أشخاص محددين.
1 قد يكونون عرضة لتحيزات الباحث نفسه؛ وذلك لأن العينات قد لا تمثل السكان بشكل كبير، مما يمكن أن يطور ميلاً مفرطًا لوجهة نظر معينة.
2 من الصعب تعميم النتائج بسبب القيود.
الجدول 1 (مستمر)
تقنيات أخذ العينات الإيجابيات السلبيات
مع المعرفة أو التجارب النادرة. عند التطبيق على السكان الأوسع.
أخذ العينات بالكرة الثلجية 2 الثقة في السكان هي النتيجة الأساسية الأخرى؛ ستؤدي إلى معدلات المشاركة من خلال زيادة استعداد الشخص لمشاركة التجارب.
1 قد ينتج عينة متجانسة، حيث سيتم تقليل التنوع؛ وبالتالي، لن تكون النتائج متحيزة.
2 الشبكات الأولية للمشاركين غير ممثلة للسكان الأوسع.
أخذ العينات بالحصص
1 يضمن أن المجموعات الفرعية المحددة موجودة في العينة، وهو شرط أساسي في البحث المعني بمثل هذه المجموعات.
2 مفيد في إجراء أبحاث السوق واستطلاعات الرأي من خلال استيعاب عدة آراء في وقت واحد.
3 يمكن تنفيذه بسرعة نسبيًا، مما يسمح بجمع البيانات في الوقت المناسب.
1 الاختيار ليس عشوائيًا؛ لذلك، قد يقدم الاختيار تحيزًا لأن المشاركين سيتم اختيارهم على أساس ‘متاح’ بدلاً من عشوائي، مما سيخلق نتائج متحيزة.
2 يؤثر ذلك على القابلية العامة للدراسة نفسها لأنها لا يمكن أن تعمم مثل هذه النتائج على السكان الأكبر.
3 إذا لم تكن الحصص محددة بشكل جيد، فقد تصبح عملية الاختيار تعسفية، مما قد يضر بجودة البيانات.

4. تحديد حجم العينة في البحث

تحديد حجم العينة أمر حيوي في البحث للحصول على نتائج صالحة وموثوقة [7،8]. في تقدير متوسطات أو نسب السكان، يضمن تطبيق الصيغة الصحيحة أن العينة المأخوذة تمثل السكان وتقلل من الخطأ [9].

4.1. صيغة تقدير نسب السكان

من بين جميع الصيغ المستخدمة في البحث، ربما الأكثر شيوعًا هي لتقدير نسبة السكان [10]. صيغة شائعة الاستخدام هي:

حيث.
  • حجم العينة المطلوب،
  • – القيمة المرتبطة بمستوى الثقة المطلوب (مثل 1.96 لمستوى ثقة 95%)،
  • النسبة المقدرة للسكان (استخدم إذا كانت غير معروفة لزيادة التباين)،
  • هامش الخطأ أو الدقة المطلوبة.
تُطبق هذه الصيغة عندما يكون الباحث مهتمًا بنسبة السكان الذين لديهم سمة معينة، مثل نسبة المدخنين أو الناخبين. كلما كان حجم العينة أكبر، قلل من هامش الخطأ E وبالتالي يوفر تقديرًا أقرب إلى الواقع.

4.2. صيغة تقدير متوسطات السكان

الصيغة لحجم العينة في الدراسات المصممة لتقدير متوسط السكان، مثل متوسط الدخل أو الطول، هي كما يلي:

حيث.
  • حجم العينة المطلوب،
  • – القيمة المرتبطة بمستوى الثقة (مثل 1.96 لمستوى الثقة ،
  • الانحراف المعياري المقدّر للسكان،
  • هامش الخطأ أو الفرق المسموح به بين متوسط العينة ومتوسط السكان.
هذه صيغة مهمة عندما يعمل المرء مع متغيرات مستمرة. كلما زاد التشتت في السكان، ، كلما كان حجم العينة أكبر الذي سيكون مطلوبًا للحصول على تقدير دقيق. وبالمثل، كلما كان هامش الخطأ أصغر، أو كلما كان مستوى الثقة أعلى، كلما كان حجم العينة أكبر المطلوب.

4.3. صيغة حجم العينة لكوخران

تُستخدم صيغة كوخران عادةً عندما يكون السكان كبيرين أو غير محدودين وتطبق على كل من النسب والمتوسطات [11]. الصيغة العامة للحساب:

حيث.
  • no = حجم العينة الأولي للسكان الكبار (قبل أي تعديلات للسكان المحدودة)،
    – القيمة (مثل 1.96 لمستوى الثقة ،
  • النسبة المقدرة للسكان (استخدم 0.5 إذا كانت غير معروفة)،
  • هامش الخطأ.
تُطبق صيغة كوخران على نطاق واسع عندما يتم استخدام استطلاع أو دراسة مقطعية، حيث يتوقع الباحث أن يكون السكان كبيرين.
إذا كان حجم السكان صغيرًا – أي محدودًا – يجب تعديل حجم العينة بواسطة تصحيح السكان المحدود. يتم ذلك بالطريقة التالية:

حيث.
  • حجم العينة المعدل،
  • no حجم العينة الأولي من صيغة كوخران أو الصيغ الأخرى،
  • حجم السكان الكلي.
سيعدل هذا حجم العينة، خاصة عندما يكون السكان صغيرين، للحفاظ على دقة النتائج دون الإفراط في أخذ العينات.

4.4. صيغة أخذ العينات الطبقية

تُستخدم العينة الطبقية عندما يمكن تقسيم السكان إلى مجموعات فرعية متميزة، أو طبقات، مثل مجموعة العمر، الجنس، أو مستوى التعليم. يمكن تحديد حجم العينة لكل طبقة باستخدام التخصيص النسبي:

حيث.
  • حجم العينة للطبقة h،
  • حجم السكان للطبقة h،
  • حجم السكان الكلي،
  • حجم العينة الكلي.
سيضمن ذلك أن العينة تمثل جميع المجموعات الفرعية في السكان المعنيين. تعتبر العينة العشوائية الطبقية مفيدة في حالة تكون فيها المجموعات الفرعية مختلفة جدًا عن بعضها البعض.

4.5. صيغة ياماني

صيغة ياماني، 1967، هي واحدة من الطرق الشائعة في أبحاث الاستطلاع المستخدمة لتقدير حجم عينة مناسب لأي سكان معين مع مراعاة الدقة والعملية [12]. تقرب هذه الصيغة حجم العينة بناءً على الحجم الكلي للسكان وهامش الخطأ المطلوب. لاستخدام هذه الطريقة، تعتبر مستويات الثقة؛ على الرغم من أنه يمكن تعديلها باستخدام مستويات ثقة أخرى.
صيغة حساب حجم العينة وفقًا لياماني هي:

أين.
  • حجم العينة
  • حجم السكان
  • هامش الخطأ

4.6. دور الجداول في تحديد حجم العينة

إحدى الوسائل الشائعة لتخفيف العبء الحسابي في تحديد حجم العينة هي من خلال استخدام الجداول المحسوبة مسبقًا. توفر هذه الجداول عمومًا تقديرات لحجم العينة لقيم محسوبة مسبقًا لهامش الخطأ، E؛ مستوى الثقة، Z؛ والنسبة المقدرة، p. توفر هذه الجداول نقاط مرجعية سريعة للباحثين الذين قد يرغبون في تقدير حجم العينة المطلوب لدقة معينة دون الحاجة بالضرورة إلى حساب صيغ معقدة (الجداول 2 و 3).

4.7. العوامل المؤثرة على حجم العينة

يتم تحديد حجم العينة في أي دراسة من خلال عدد من العوامل. أولاً، هناك حجم السكان الذين سيتم سحب العينة منهم؛ قد تتطلب السكان الأكبر نهجًا مختلفًا عن الأصغر. ثانيًا، يؤثر مستوى الثقة المطلوب بشكل كبير على حجم العينة؛ كلما زاد مستوى الثقة – 95 في المئة مقارنة بـ 90 في المئة، على سبيل المثال – كان يجب أن يكون حجم العينة أكبر. تشمل الاعتبارات المهمة الأخرى هامش الخطأ – حيث يرتبط الهامش الأصغر بحجم عينات أكبر لضمان أن تكون النتائج دالة على المعلمات الحقيقية في السكان. قد تؤثر التباين داخل السكان أيضًا على حجم العينة؛ كلما زاد التباين، زاد عدد المشاركين، بشكل عام، الذي سيتعين على المرء جمعه لتغطية النطاق. من المهم أيضًا النظر في حجم التأثير والقوة الإحصائية: مع أحجام تأثير أصغر ومستويات عالية من القوة، تكون العينات الأكبر مطلوبة لاكتشاف الفروق ذات الدلالة. أي تصميم دراسة – مقطعي، طولي، أو تجريبي – سيحدد أيضًا متطلبات حجم العينة. أخيرًا، قد يكون معدل التسرب المتوقع – على سبيل المثال، عدد المتسربين أو عدم الاستجابات – هو السبب في تعديل حجم العينة الأولي لضمان عدد كافٍ من المشاركين لإكمال الدراسة. ستؤدي العوامل المذكورة، إذا تم النظر فيها بعناية، إلى حجم عينة كافٍ ليس فقط لدعم
الجدول 2
أحجام العينات المطلوبة لمختلف أحجام السكان عند مستوى الثقة مع هوامش خطأ مختلفة ، و ).
– تباين السكان
– مستوى الثقة =
حجم السكان حجم العينة المطلوب (هامش الخطأ ) حجم العينة المطلوب (هامش الخطأ %) حجم العينة المطلوب (هامش الخطأ %)
50 ٤٤ ٤٨ 50
75 63 70 74
100 79 91 99
150 ١٠٨ 132 148
٢٠٠ 132 168 196
٢٥٠ 151 ٢٠٣ 244
٣٠٠ 168 234 291
٤٠٠ 196 291 384
٥٠٠ 217 ٣٤٠ ٤٧٥
٦٠٠ 234 384 565
٧٠٠ 246 423 ٦٥٢
٨٠٠ ٢٦٠ 457 738
1000 ٢٧٨ ٥١٦ 906
١٥٠٠ 306 624 1297
٢٠٠٠ ٣٢٢ 696 1655
٣٠٠٠ ٣٤١ 787 2286
5000 ٣٥٧ 879 ٣٢٨٨
“10,000” in Arabic is “عشرة آلاف”. 370 964 ٤٨٩٩
25,000 378 ١٠٢٣ 6939
٥٠٠٠٠ 381 1045 8057
100,000 ٣٨٣ 1056 8762
٢٥٠,٠٠٠ 384 1063 9249
٥٠٠,٠٠٠ 384 1065 9423
1,000,000 384 1066 9513
المصدر (Gill et al., 2010) [13].
الجدول 3
أحجام العينات المطلوبة لمختلف أحجام السكان عند مستوى الثقة مع هوامش خطأ مختلفة ، و ).
– تباين السكان
– مستوى الثقة =
حجم السكان حجم العينة المطلوب (هامش الخطأ %) حجم العينة المطلوب (هامش الخطأ %) حجم العينة المطلوب (هامش الخطأ %)
50 ٤٦ ٤٩ 50
75 67 72 75
100 87 95 99
150 ١٢٢ ١٣٩ 149
٢٠٠ 154 180 198
٢٥٠ 181 220 246
٣٠٠ ٢٠٦ 258 ٢٩٥
٤٠٠ 249 ٣٢٨ 391
٥٠٠ ٢٨٥ ٣٩٣ ٤٨٥
٦٠٠ 314 ٤٥٢ 579
٧٠٠ ٣٤٠ ٥٠٧ 672
٨٠٠ ٣٦٢ ٥٥٧ 763
1000 398 ٦٤٧ 943
١٥٠٠ ٤٥٩ ٨٢٥ 1375
٢٠٠٠ 497 957 1784
٣٠٠٠ 541 1138 2539
5000 583 1142 ٣٨٣٨
10,000 620 1550 ٦٢٢٨
25,000 643 1709 9944
٥٠٠٠٠ ٦٥٢ 1770 12,413
100,000 ٦٥٦ 1802 14,172
٢٥٠,٠٠٠ 659 1821 15,489
٥٠٠,٠٠٠ ٦٦٠ 1828 ١٥٩٨٤
1,000,000 660 1831 ١٦٢٤٤
المصدر (Gill et al., 2010) [13].
الشكل 3. العوامل المؤثرة على حجم العينة.
أهداف الدراسة ولكن أيضًا إنتاج نتائج ذات دلالة إحصائية. العوامل المؤثرة على حجم العينة موضحة في الشكل 3.

5. الخاتمة

تعتمد دقة المنهجية في البحث على اختيار تقنيات أخذ العينات المناسبة وحساب حجم العينة المناسب. تعتبر أخذ العينات الاحتمالية، مثل أخذ العينات الطبقية وأخذ العينات العنقودية، أساسية في الدراسات التي تهدف إلى إجراء استنتاجات ذات دلالة إحصائية حول السكان الأوسع. بالمقابل، تقدم طرق أخذ العينات غير الاحتمالية طرقًا عملية عند إجراء أبحاث استكشافية أو عندما لا يمكن الوصول إلى كامل السكان. يعد الحساب الدقيق لحجم العينة خطوة مهمة جدًا في أي مشروع بحثي. يؤثر هذا العامل بشكل كبير على القوة الإحصائية ودقة الاستنتاجات التي يمكن استخلاصها من أي دراسة. لا يمكن أن تؤدي العينات الصغيرة إلى نتائج حاسمة، بينما العينات الكبيرة جدًا تعتبر مضيعة لأنها لن تضيف شيئًا إلى صحة الدراسة. تظل مستويات الثقة، وهامش الخطأ، وحجم التأثيرات من بين العوامل الرئيسية التي تساعد الباحثين على ضمان أن تصاميم أبحاثهم تسهل الحصول على نتائج قوية. في هذا الصدد، تشمل الإرشادات المنهجية طرقًا يمكن للباحث من خلالها المساهمة في تقدم المعرفة العلمية من خلال إعداد أعمال سيشير إليها باحثون آخرون كأساس لسنوات قادمة. نأمل أن يضع هذا الدليل معيارًا فيما يتعلق بمنهجية البحث وبالتالي يعمل كنقطة مرجعية للعلماء الملتزمين بإنتاج أعمال بأعلى المعايير التجريبية والنظرية، بهدف نهائي يتمثل في زيادة التأثير وإمكانية الاقتباس من الأبحاث على مستوى عالمي.

الموافقة الأخلاقية

لم يكن من الضروري الحصول على موافقة أخلاقية، حيث أن الدراسة التي تم إجراؤها لم تتضمن أي مخاوف أو قضايا أخلاقية.

تمويل

لم يتلقَ هذا المقال أي دعم مالي.

توفر البيانات

لم يتم استخدام أي بيانات في البحث الموصوف في هذه المقالة.

بيان مساهمة مؤلفي CRediT

سيروان خالد أحمد: التصور، تنظيم البيانات، الإشراف، الكتابة – المسودة الأصلية.

إعلان عن تضارب المصالح

يعلن المؤلفون أنهم ليس لديهم أي تضارب مالي معروف
المصالح أو العلاقات الشخصية التي قد تكون بدت وكأنها تؤثر على العمل المبلغ عنه في هذه الورقة.

شكر وتقدير

شكرًا لجميع المراجعين الأقران والمحررين على آرائهم واقتراحاتهم ودعمهم لهذا البحث.

References

[1] Elfil M, Negida A. Sampling methods in clinical research; an educational review. Emerg (Tehran, Iran) 2017;5:e52. https://sid.ir/paper/339768/en.
[2] Andrade C. The inconvenient truth about convenience and purposive samples. Indian J Psychol Med 2020;43:86-8. https://doi.org/10.1177/ 0253717620977000.
[3] Shorten A, Moorley C. Selecting the sample. Evid Base Nurs 2014;17:32-3. https:// doi.org/10.1136/eb-2014-101747.
[4] Rahman MM. Sample size determination for survey research and non-probability sampling techniques: a review and set of recommendations. J Entrep Bus Econ
2023;11(1 11):42-62. https://www.scientificia.com/index.php/JEBE/article/view ?path=.
[5] Suresh K, V Thomas S, Suresh G. Design, data analysis and sampling techniques for clinical research. Ann Indian Acad Neurol 2011;14:287-90. https://doi.org/ 10.4103/0972-2327.91951.
[6] Taherdoost H. Sampling methods in research methodology; how to choose a sampling technique for research. Int J Acad Res Manag 2016;5:18-27.
[7] Krejcie R, Morgan D. Determining sample size for research activities. Educ Psychol Meas 1970;30:607-10. https://doi.org/10.1177/001316447003000308.
[8] Altman DG. Practical statistics for medical research. first ed. New York: Chapman and Hall/CRC; 1990. https://doi.org/10.1201/9780429258589.
[9] Rodríguez del Águila MM, González-Ramírez AR. Sample size calculation. Allergol Immunopathol 2014;42:485-92. https://doi.org/10.1016/j.aller.2013.03.008.
[10] Daniel WW, Cross CL. Biostatistics: a foundation for analysis in the health sciences. tenth ed. New York, NY, USA: John Wiley & Sons; 2018.
[11] Cochran WG. Sampling techniques. second ed. Inc, New York: ohn Wiley and Sons; 1963.
[12] Yamane T. Statistics: an introductory analysis. second ed. New York: Harper and Row; 1967.
[13] Gill J, Johnson P. Research methods for managers. Sage; 2010.

    • College of Nursing, University of Raparin, Rania, Sulaymaniyah, Kurdistan Region, 46012, Iraq.
    E-mail addresses: sirwan.k.ahmed@gmail.com, sirwan.kahmed@uor.edu.krd.

Journal: Oral Oncology Reports, Volume: 12
DOI: https://doi.org/10.1016/j.oor.2024.100662
Publication Date: 2024-09-26

How to choose a sampling technique and determine sample size for research: A simplified guide for researchers

Sirwan Khalid Ahmed Ministry of Health, General Health Directorate of Raparin, Rania, Sulaymaniyah, Kurdistan Region, 46012, Iraq College of Nursing, University of Raparin, Rania, Sulaymaniyah, Kurdistan Region, 46012, Iraq

ARTICLE INFO

Keywords:

Sampling
Sample size
Sampling technique
Sample size calculations
Sample size table
Sampling process
Probability sampling
Non-probability sampling
Quantitative research
Confidence level
Margin error
Population size
Effect size
Validity
Reliability
Survey research
Study design

Abstract

An appropriate sampling technique with the exact determination of sample size involves a very vigorous selection process, which is actually vital for any empirical research. It is obvious that these methodological decisions would greatly affect the internal and external validity and the overall generalizability of the study findings. This paper has comprehensively updated the guidelines on sampling methods and sample size calculation, hence giving enough evidence that will be beneficial in assisting researchers to advance the credibility and statistical power of their research work. The differences between probability sampling techniques, including simple random sampling, stratified sampling, and cluster sampling, and non-probability methods, such as convenience sampling, purposive sampling, and snowball sampling, have been fully explained. Probability is the only that can ensure the generalizability, while non-probability sampling is useful in exploratory situations. Another significant process is the determination of an optimal sample size, which, among other things, has to take into account the total population size, effect size, statistical power, confidence level, and margin of error. The paper contributes both theoretical guidance and practical tools that researchers need in choosing appropriate strategies for sampling and validating methodologically appropriate sample size calculations. In sum, such a paper sets the standard for best practice in research methodology that will drive reliability, validity, and empirical rigor across diverse studies.

1. Introduction

The empirical study will be accurate and valid when the proper sample technique will be cautiously selected. Sampling technique involve the selection of a subset from the larger population and are core to research, since through sampling, the nature and generalizability of findings depend on it [1]. The success of any study would depend upon the appropriateness of the sampling method.
The rationale for sampling methodologies is the capability of such procedures to infer characteristics about populations without the unrealistic expectation inherent in evaluating an entire group. This is very important and necessary in cases where complete enumeration becomes impossible for a given population due to such operational issues as time, resources, or access restrictions. A properly chosen sample would capture and enhance the external validity and generalizability of the findings [2].
It is generally divided into two: probability and non-probability
sampling [1,3]. Probability sampling includes basic random sampling, stratified sampling, and cluster sampling, where methods of selection depend on the randomization process as a strengthening process to reduce selection bias. These methods boast of sound statistical tenets and are usually adopted when generalization is intended. Non-probability sampling methods include convenience and purposive sampling whenever random selection is not feasible or practical. These may be convenient for practical purposes, but they will rapidly lead to biases in the sample that then will affect the generalization of results [4].
The selection of the sampling method is intrinsically identified with a few specific research goals, some demographic features of the target population, and some methodological limitations of the study. Proper selection of sampling technique bears great relevance to the validity and generalization of the study outcomes. This calls for wide-ranging acquaintance with different sampling procedures and their consequences on the part of the researcher who intends to be methodologically correct.
The article tried to discuss various approaches to sampling in
research methodology, and determine the most appropriate sample size calculations so that the researcher may choose the best fit for a particular research situation. This paper will attempt to give a close look at the pros and cons of the different procedures of sampling in promoting best practices of research and enhancing empirical validity.

2. Sampling process in research

The sampling process is one of the most important parts of the research methodology, through which accuracy and validity of findings from a study are guaranteed [5]. This process starts with the identification of a target population, which could be a total group of persons or entities relating to the research question. Defining clearly and properly what constitutes a population is highly important to make sure that the sample describes the group under study. Population means the definition that should reflect such an attribute like demographic variables, geographic location, and every other feature which could be relevant for research.
Having defined the population, the next process is the choice of a suitable sampling method. In view of research goals and resources and a need for generalization, researchers have to choose between probability and non-probability sampling methods. The justification for preference, if the objective is to make inferences about the population, normally includes the following probability sampling methods: simple random sampling, stratified sampling, cluster sampling, and systematic sampling. Convenience sampling, purposive sampling, and snowball sampling are some of the methods generally adopted in non-probability methods for exploratory studies or when the population is not accessible.
Once the selection of a sampling plan is effected, the size of this sample has to be determined by the researcher, and this is taken as vital for the reliability of the results. In calculating sample size, several factors may be important: the size of the population, the effect size one expects, the confidence level, and the margin of error. This can be achieved with the help of statistical techniques or tools in order not to have too small a sample that would yield untrustworthy results, or too large in which case resources will be wasted.
Sampling selection refers to the stage where the chosen sampling method will decide who or which units in the population should constitute a study. This could be done through random number generation or systematic selection methods in the case of probability sampling. In non-probability sampling, it could be related to accessible or particular cases that are relevant to the study at hand.
Finally, the researcher must analyze the data obtained from the sample, taking into consideration that no conclusion can be made if the sampling procedure is not considered. In other words, it is to have in mind how biased the sample can be, or where the limitation is and whether generalization to the whole population is feasible. A formal sampling plan will enable the researcher to enhance the validity and reliability of the results and, therefore the accuracy and meaningfulness of his conclusions. Steps of Sampling process are presented in Fig. 1.

3. Sampling techniques

Differentiating between the two, probability sampling and nonprobability sampling are mainly two different strategies adopted in research for the selection of participants [6]. Each has its own advantages and disadvantages. Probability sampling assures that every subject from the population carries a known, nonzero possibility of selection. The randomization in this design reduces selection bias and makes the sample representative of the population as a whole. Probability sampling provides the researcher with the chance to make generalizations from the sample to the population and estimate the sampling error with a measure of confidence. Examples of techniques falling under this category include simple random sampling, stratified sampling, and cluster sampling. While probability sampling is accurate, it tends to be
Fig. 1. Sampling process steps.
cumbersome and requires much time and resources, especially when the base of the population being targeted is very large or scattered since it is based on a detailed listing of the population and selections must be done using a complex procedure.
On the contrary, non-probability sampling encompasses no randomization; therefore, not all subjects in the population carry an equal or known probability of selection. This is mainly used when it is not possible for the researchers to reach the entire population or when the resources and time are limited. Some of the non-probability sampling methods include convenience sampling, purposive sampling, and snowball sampling, in which the judgment of the researcher or the availability of participants is depended on. This latter method, while faster, inexpensive, and easier to carry out, has the liability of selection bias-that is, the sample chosen may eventually contain overrepresentation or underrepresentation of groups. Results from nonprobability sampling therefore have limited generalizability to the population-at-large, and statistical inference cannot be carried out as confidently. It is, however, very useful in exploratory research, qualitative studies, and where the intention is to study some of those difficult-to-reach subgroups rather than to represent the whole population.
Where the research situation calls for a high degree of accuracy and generalization of results to the whole population, the preference is for probability sampling. Only in small-scale or exploratory studies can one resort to non-probability sampling when logistical constraints or focus groups turn out to be more important than representativeness. Both techniques have a place in research, but the choice of one or the other depends upon research objectives, resources, and needs regarding statistical reliability. Fig. 2 and Table 1 summarize probability and nonprobability sampling techniques in detail, together with a number of advantages and disadvantages associated with each technique. This should be helpful in enabling the researcher to choose the most
Fig. 2. Sampling techniques in research.
appropriate sampling method for their studies.

3.1. Probability sampling methods

3.1.1. Simple random sampling

The simple random sample, although very basic, is an effective method of ensuring that every single member of the population will have a chance of being selected. Following definition and compilation of a complete list of members constituting the population, the defining of the sample size, then the actual random selection using a random number generator or drawing of lots commences. This is highly valued because it reduces selection bias, although it might be very demanding in logistics, especially when the population is so big or dispersed.

3.1.2. Stratified sampling

In stratified sampling, the population would be divided into distinct groups, commonly known as strata, based on uniform categories such as age, sex, or education. Random samples would then be taken from each stratum to derive a sample representative of the entire range of categories. This will increase the accuracy of the estimates, given that every subgroup is well-represented, thereby making this method more suitable for populations where great variability in key characteristics exists. However, it is difficult to meaningfully form strata if detailed knowledge of the population does not exist.

3.1.3. Cluster sampling

Cluster sampling is a method of simplifying the process of data collection whereby a population is divided into clusters, which may be geographic locations or institutions, and a random selection is taken from these for study. All members in the selected clusters will then be included in the sample. It will be very useful in large-scale studies where compiling a complete list of the population would be highly impractical. Though cluster sampling is inexpensive, it might introduce biases if the selected clusters are not typical of the overall population.

3.1.4. Systematic sampling

In systematic sampling, every individual is chosen in a continuous manner from a population list, starting from a random point. It is efficient and quite easy to conduct because it is based on a regular sampling interval. Systematic sampling may be biased, however, if there is an inherent pattern in the population that coincides with the sampling interval.

3.1.5. Multi-stage sampling

In multi-stage sampling, a population is divided into a number of stages or levels. For example, in cluster sampling – a complicated form of
multi-stage sampling – populations are divided into large clusters (for instance, regions or institutions), from which further random samples are drawn in successive stages. Once geographic areas are selected, for example, a random sample of individuals within each area could be selected. The stepwise stratification is useful in large-scale studies to systematically reduce the sample size by narrowing down through vast or dispersed populations. While this may save costs and time, there is a risk of increased sampling error at each stage in the selection process, if the sampling at each level is not representative.

3.2. Non-probability sampling methods

3.2.1. Convenience sampling

Of the various methods of data collection, convenience sampling involves drawing samples from that portion of the population which the researcher finds most accessible [2]. This is a fast and cheap method of collecting data when either time or resources are in short supply. However, in most instances, this method introduces bias, since the sample may not be representative and thus generalization of the findings to the rest of the population will not be possible.

3.2.2. Purposive sampling

In purposive sampling, also known as judgmental or expert sampling, the participants are selected based on the judgment of the researcher who decides who will be most useful for the data required [2]. This is normally used in research requiring certain people with some specific characteristics or expertise. Though the method can result in very profound insights, it carries a very high risk of bias on the part of the researcher and may not represent the whole population.

3.2.3. Snowball sampling

Snowball sampling is utilized when one is studying hidden or hard-to-reach populations. In this case, participants are required to refer those that also fit the criteria for study participants, making a network of referrals. This technique is useful in exploratory research. However, it has been criticized to lead to biased samples because samples get homogeneous over time due to social networks.

3.2.4. Quota sampling

Quota sampling refers to the process whereby the population is divided into mutually exclusive subgroups from which participants are selected, ensuring that certain quotas within each subgroup are filled. Quotas ensure that certain characteristics of the population exist within the sample; however, the actual selection within the subgroup remains non-random, hence biased and a less representative sample.
Table 1
Pros and Cons of Probability and Non-Probability Sampling techniques.
Sampling techniques Pros Cons
Simple Random Sampling
1 It makes the process fair for every person to have an equal opportunity to be selected without any bias.
2 It is easy to perform statistical tests on because of its random nature.
3 Selection bias would be less likely to occur, with more reliable and generalizable findings.
1 It requires a full and accurate count of the population, which sometimes is hard to obtain, especially in large or mixed populations.
2 It can become resourceintensive and timeconsuming, especially in the case of large populations.
3 Unless the sample size is sufficiently large, randomness will not capture rare subgroups.
Systematic Sampling
1 The method is easier to apply than simple random sampling in large populations.
2 The selection is done in an orderly manner, which helps the organization.
3 Generally, more effective than simple random sampling in terms of time and resources.
1 May bring bias if the periodic pattern in the population list coincides with the interval used for sampling, resulting in over- or underrepresentation of particular characteristics.
2 Less random than simple random sampling, thus it can reduce the diversity of the sample.
Stratified Sampling
1 Ensuring representation of key subgroups, or strata, leads to more precise and relevant estimates.
2 It ensures statistical efficiency is increased and variability within strata reduced, hence increasing its reliability.
3 Could enhance comparability between different strata to allow focused insight.
1 In the formation of strata, there is a need for detailed knowledge of population characteristics, which may not be available.
2 More complex to carry out and interpret than straightforward methods, and demands more advance thinking
Cluster Sampling
1 Inexpensive and effective for the geographically dispersed population to reduce costs associated with traveling.
2 Saves resources and time to collect data; hence, making big studies viable.
3 Useful in cases where the complete list of the population is not available and when only cluster information is needed.
1 Clusters may not be homogenous, and this could increase the variability of the clusters and distort the results.
2 Analysis can be difficult where clusters are poorly defined or differ significantly.
Convenience Sampling
1 Data collection is fast and cheap; hence, one can get results in a very short period.
2 Useful in preliminary studies or as a pilot test when time/resources are scant.
3 Relatively easy to conduct, especially in familiar settings such as hospitals or community centers.
1 There is a high risk of selection bias, which will mean the results cannot be generalized across the whole population because of poor external validity.
2 It may reflect only the experiences or views of a particular group and hence give biased results.
Purposive Sampling
1 One can study issues and populations particularly relevant to the research question in greater depth.
2 Appropriate for qualitative research, especially in cases when certain information about experiences or expertise is needed.
3 It allows data collection focusing on specific people
1 They may be subject to the biases of the researcher himself; this is because the samples may not represent the overall population highly, which can develop an over-inclination of the particular point of view.
2 The finding is hard to generalize due to limitation
Table 1 (continued)
Sampling techniques Pros Cons
with rare knowledge or experiences. on application to the wider population.
Snowball Sampling 2 The trust in populations is the other elementary outcome; it will lead to participation rates by increasing a person’s willingness to share experiences.
1 A homogenous sample may result, whereby diversity will be reduced; hence, results will not be biased.
2 Initial participants’ networks are unrepresentative of wider populations.
Quota Sampling
1 Assures that specific subgroups are present in the sample, which is a prime requisite in research concerned with such groups.
2 It is helpful in conducting market research and opinion polls by grasping several opinions simultaneously.
3 Can be implemented relatively fast, thus allowing for timely data collection.
1 Selection is not random; therefore, the selection may introduce bias because participants would be selected in an ‘available’ basis rather than randomly, which will create biased outcomes.
2 This impinges on the general applicability of the study itself because it cannot generalize such findings to the larger population.
3 If the quotas are not well-set, then the selection process might get arbitrary, which could compromise data quality.

4. Sample size determination in research

The sample size determination is vital in research for valid and reliable results [7,8]. In the estimation of population means or proportions, applying the correct formula ensures that the sample taken represents the population and minimizes error [9].

4.1. Formula for estimating population proportions

Among all formulas used in research, perhaps the most common is for estimating a population proportion [10]. A commonly used formula is:

Where.
  • required sample size,
  • -value associated with the desired confidence level (e.g., 1.96 for 95 % confidence),
  • estimated population proportion (use if unknown to maximize variability),
  • margin of error or desired precision.
This formula is applied when a researcher is interested in the proportion of a population with a particular attribute, such as the percentage of smokers or voters. A larger sample size reduces the margin of error E and hence provides an estimate closer to actuality.

4.2. Formula for estimating population means

The formula for sample size in studies designed to estimate a population mean, such as average income or height, is given by:

Where.
  • required sample size,
  • -value corresponding to the confidence level (e.g., 1.96 for confidence),
  • estimated population standard deviation,
  • margin of error or allowable difference between the sample mean and the population mean.
This is an important formula when one is working with continuous variables. The greater the dispersion in the population, , the larger the sample that will be needed in order to have an accurate estimate. Similarly, the smaller the margin of error, or the higher confidence level, the greater the sample size needed.

4.3. Cochran’s sample size formula

Cochran’s formula is normally used when the population is large or infinite and applies to both proportions and means [11]. The general formula for the calculation:

Where.
  • no = initial sample size for large populations (before any adjustments for finite populations),
    -value (e.g., 1.96 for confidence),
  • estimated population proportion (use 0.5 if unknown),
  • margin of error.
Cochran’s formula is widely applied when a survey or a crosssectional study is used, in which the researcher expects the population to be large.
If the size of the population is small-that is, finite-the sample size has to be adjusted by the finite population correction. This is done in the following manner:

Where.
  • adjusted sample size,
  • no initial sample size from Cochran’s formula or the other formulas,
  • total population size.
This will adjust the sample size, especially when the population is small, to retain precision of results without over-sampling.

4.4. Formula for stratified sampling

Stratified sampling is used when a population can be divided into distinct subgroups, or strata, such as age group, gender, or level of education. The sample size for each stratum can be determined by the use of proportional allocation:

Where.
  • sample size for stratum h ,
  • population size for stratum h ,
  • total population size,
  • overall sample size.
This would ensure that the sample is representative of all subgroups in the population of interest. Stratified random sampling is useful in a situation where the subgroups are very different from one another.

4.5. Yamane’s formula

Yamane’s formula, 1967, is one of the common methods in survey research used to estimate an appropriate sample size for any given population with concern for precision and practicality [12]. This formula approximates the sample size based on the total size of a population and desired margin of error. For using this method, confidence levels are considered; although it can be modified using other confidence levels.
The formula for Yamane’s sample size calculation is:

Where.
  • sample size
  • population size
  • margin of error

4.6. The role of tables in sample size determination

One common means of easing the computational burden in determining sample size is through the use of precalculated tables. These tables generally provide sample size estimates for precalculated values of the margin of error, E; confidence level, Z; and estimated proportion, p. Such tables provide quick reference points for researchers who may want to estimate a required sample size for a certain accuracy without necessarily having to compute complicated formulae (Tables 2 and 3).

4.7. Factors affecting sample size

The sample size of any study is determined by a number of factors. First, there is the size of the population from which the sample is to be drawn; larger populations may require a different approach than smaller ones. Second, the desired confidence level significantly influences sample size; the higher the confidence level-95 percent compared to 90 percent, for example-the larger the sample size must be. Other important considerations include margin of error-smaller margins are associated with larger sample sizes to ensure findings indicative of true parameters in a population. The variability within the population might also affect sample size; the larger the variability, the more participants, generally speaking, one will have to capture the range in. It is equally important to look at the effect size and statistical power: with smaller effect sizes and high levels of power, larger samples are needed to detect meaningful differences. Any study design-cross-sectional, longitudinal, or experimental-will further stipulate sample size requirements. Lastly, the expected attrition rate-for example, the number of dropouts or non-responses-may be the reason for an adjustment of the initial sample size to ensure a sufficient number of participants complete the study. The said factors, if considered with due deliberation, will lead a researcher to such a sample size that is sufficient not only to support the
Table 2
Required sample sizes for various population sizes at confidence level with different margins of error ( , and ).
– Variance of the population
– Confidence Level =
Popultion size Required sample size (Margin of Error ) Required sample size (Margin of Error %) Required sample size (Margin of Error %)
50 44 48 50
75 63 70 74
100 79 91 99
150 108 132 148
200 132 168 196
250 151 203 244
300 168 234 291
400 196 291 384
500 217 340 475
600 234 384 565
700 246 423 652
800 260 457 738
1000 278 516 906
1500 306 624 1297
2000 322 696 1655
3000 341 787 2286
5000 357 879 3288
10,000 370 964 4899
25,000 378 1023 6939
50,000 381 1045 8057
100,000 383 1056 8762
250,000 384 1063 9249
500,000 384 1065 9423
1,000,000 384 1066 9513
Source (Gill et al., 2010) [13].
Table 3
Required sample sizes for various population sizes at confidence level with different margins of error ( , and ).
– Variance of the population
– Confidence Level =
Population size Required sample size (Margin of Error %) Required sample size (Margin of Error %) Required sample size (Margin of Error %)
50 46 49 50
75 67 72 75
100 87 95 99
150 122 139 149
200 154 180 198
250 181 220 246
300 206 258 295
400 249 328 391
500 285 393 485
600 314 452 579
700 340 507 672
800 362 557 763
1000 398 647 943
1500 459 825 1375
2000 497 957 1784
3000 541 1138 2539
5000 583 1142 3838
10,000 620 1550 6228
25,000 643 1709 9944
50,000 652 1770 12,413
100,000 656 1802 14,172
250,000 659 1821 15,489
500,000 660 1828 15,984
1,000,000 660 1831 16,244
Source (Gill et al., 2010) [13].
Fig. 3. Factors affecting sample size.
objectives of the study but also produce results which are statistically significant. The factors affecting sample size are illustrated in Fig. 3.

5. Conclusion

The precision of methodology in research depends on the selection of proper sampling techniques and calculation of an adequately powered sample size. Probability sampling, for example, stratified and cluster sampling, is thus fundamental in those studies that tend to make statistically significant inferences about the wider population. By contrast, non-probability sampling methods offer pragmatic ways when one conducts exploratory research or where full population access cannot be made. Precise calculation of sample size is a very important step in any research project. This factor has a great bearing on the statistical power and the precision of conclusions that may be drawn from any study. Undersized samples cannot yield conclusive results, whereas samples that are too big are wasteful because they will add nothing to the validity of the study. Confidence level, margin of error, and size of effects remain some of the key determinants that help researchers ensure their research designs facilitate strong findings. In that respect, the methodological guidelines include ways a researcher can contribute to the advance of scientific knowledge by setting up works that other researchers will refer to as foundational many years to come. This guide hopefully sets a benchmark with regard to research methodology and thus serves as a reference point for scholars committed to the production of work of the highest empirical and theoretical standards, with an ultimate aim of globally increasing the impact and citation potential of the research.

Ethical approval

The ethical approval was not required, as the study conducted did not involve any ethical concerns or issues.

Funding

This article did not receive any financial support.

Data availability

No data were used in the research described in this article.

CRediT authorship contribution statement

Sirwan Khalid Ahmed: Conceptualization, Data curation, Supervision, Writing – original draft.

Declaration of competing interest

The authors declare that they have no known competing financial
interests or personal relationships that could have appeared to influence the work reported in this paper.

Acknowledgements

Thanks to all the peer reviewers and editors for their opinions and suggestions and for their support of this research.

References

[1] Elfil M, Negida A. Sampling methods in clinical research; an educational review. Emerg (Tehran, Iran) 2017;5:e52. https://sid.ir/paper/339768/en.
[2] Andrade C. The inconvenient truth about convenience and purposive samples. Indian J Psychol Med 2020;43:86-8. https://doi.org/10.1177/ 0253717620977000.
[3] Shorten A, Moorley C. Selecting the sample. Evid Base Nurs 2014;17:32-3. https:// doi.org/10.1136/eb-2014-101747.
[4] Rahman MM. Sample size determination for survey research and non-probability sampling techniques: a review and set of recommendations. J Entrep Bus Econ
2023;11(1 11):42-62. https://www.scientificia.com/index.php/JEBE/article/view ?path=.
[5] Suresh K, V Thomas S, Suresh G. Design, data analysis and sampling techniques for clinical research. Ann Indian Acad Neurol 2011;14:287-90. https://doi.org/ 10.4103/0972-2327.91951.
[6] Taherdoost H. Sampling methods in research methodology; how to choose a sampling technique for research. Int J Acad Res Manag 2016;5:18-27.
[7] Krejcie R, Morgan D. Determining sample size for research activities. Educ Psychol Meas 1970;30:607-10. https://doi.org/10.1177/001316447003000308.
[8] Altman DG. Practical statistics for medical research. first ed. New York: Chapman and Hall/CRC; 1990. https://doi.org/10.1201/9780429258589.
[9] Rodríguez del Águila MM, González-Ramírez AR. Sample size calculation. Allergol Immunopathol 2014;42:485-92. https://doi.org/10.1016/j.aller.2013.03.008.
[10] Daniel WW, Cross CL. Biostatistics: a foundation for analysis in the health sciences. tenth ed. New York, NY, USA: John Wiley & Sons; 2018.
[11] Cochran WG. Sampling techniques. second ed. Inc, New York: ohn Wiley and Sons; 1963.
[12] Yamane T. Statistics: an introductory analysis. second ed. New York: Harper and Row; 1967.
[13] Gill J, Johnson P. Research methods for managers. Sage; 2010.

    • College of Nursing, University of Raparin, Rania, Sulaymaniyah, Kurdistan Region, 46012, Iraq.
    E-mail addresses: sirwan.k.ahmed@gmail.com, sirwan.kahmed@uor.edu.krd.