هدف نهایی در اکثر مطالعات کمی استنباط نتایج و تعمیم آن به کل جامعه هدفی میباشد که نمونهها از آن جمعآوری گردیده است. استنباط حاصله از نمونهها مرتبط با برخی از پارامترهای جامعه همانند میانگین، انحراف معیار و یا برخی دیگر از جزئیات همانند نسبت یک صفت یا ویژگی در جامعه میباشد. اما سوال واقعی اینجاست که چه تعداد نمونه باید جمع آوری گردد تا بتوانیم نتایج را به جامعه هدف تعمیم دهیم. فرمول کوکران تا حدودی به این سوال پاسخ میدهد.
ویلیام کوکران در سال 1977 کتابی با عنوان تکنیکهای نمونه گیری را ارائه داد و فرمولهایی که امروزه با عنوان فرمول کوکران میشناسیم برگرفته از کتاب تکنیکهای نمونهگیری میباشد که در آن انواع روشهای نمونهگیری و نیزتعیین حجم نمونه را بیان نموده است. فرمولهای کوکران برای مطالعات مختلف با متغیرهای پیوسته و گسسته ارائه گردیده است.
فرمول کوکران به شما امکان انتخاب حجم نمونه را با توجه به دقت دلخواه، سطح اطمینان مطلوب و نسبت یا میانگین برآورد شده از ویژگی صفت مورد نظر در جامعه را میدهد. با توجه به اینکه فرمول کوکران برای دادههای پیوسته و گسسته متفاوت میباشد، قبل از اینکه بتوانیم حجم نمونه را در یک مطالعه تعیین نماییم لازم است که آشنایی اولیه با مبانی تعیین حجم نمونه در مطالعات پژوهشی و یا مواردی که برای تعیین حجم نمونه با استفاده از فرمول کوکران لاز است را باید بدانیم.
مبانی تعیین حجم نمونه
تعیین حجم نمونه در یک مطالعه مبانی مختلفی دارد که از آن جمله میتوان به متغیرهای اولیه اندازهگیری، برآورد خطا، سطح آلفا، حاشیه خطای قابل قبول و برآورد واریانس یا نسبت اشاره نمود.
متغیرهای اولیه اندازه گیری
اینکه چه متغیری را برای قرارگیری در فرمول تعیین حجم نمونه قرار دهیم از مبانی تعیین حجم نمونه میباشد. بعنوان مثال اگر محقق قصد دارد که از یک گزینه 7 مقیاسی برای رضایت شغلی استفاده کند و همچنین در نظر دارد که پاسخ دهندگان مختلفی بر حسب یک متغیر کیفی همانند جنسیت، سطح تحصیلات و … در نظر بگیرد، اینکه کدام متغیر باید بعنوان مبنای حجم نمونه در نظر گرفته شود یک سوال اساسی است.
این سوال به دلیل این اهمیت دارد که بعنوان مثال در نظر گرفتن یک متغیر به عنوان متغیر شاخص همانند جنسیت میتواند موجب حجم نمونه بزرگتری در مقایسه با سایر متغیرها همانند متغیر 7 مقیاسی بعنوان متغیر شاخص گردد.
کوکران در سال 1977 به حل این مشکل پرداخت. این مشکل از نظر وی از طریق در نظر گرفتن حاشیههای خطا برای آیتمهایی است که بعنوان حیاتیترین متغیرها در مطالعه در نظر گرفته میشوند، قابل حل است. در واقع باید برای هر متغیر مهم و حیاتی به صورت جداگانه حجم نمونه برآورد شود. با اینکار حجم نمونههای (n) مختلفی به دست میآید که حجم نمونههای کمتر معمولا مربوط به متغیرهای مقیاسبندی شده و پیوسته است و حجم نمونههای بالا معمولا مربوط به متغیرهای کیفی یا دوگانه میباشد.
محقق میتواند تصمیم بگیرد که اگر n برای متغیرهای مورد نظر تا حدودی نزدیک به یکدیگر باشد میتواند به سادگی از n بزرگتر به عنوان حجم نمونه استفاده نماید و اطمینان داشته باشد که اطلاعات به دست آمده بر حسب نمونه تعیین شده نتایج قابل قبول را ارائه دهد.
اما معمولا تفاوت کافی بین n ها ی به دست آمده بر اساس متغیرهای مختلف وجود دارد اما محققین اکثرا ترجیح میدهند که حجم نمونه کمتر را انتخاب نمایند که میتواند دلایلی همچون در نظر گرفتن منابع مالی در مطالعه و یا به دلیل اینکه این حجم نمونه میتواند دقت استاندارد بیشتر از نیاز آنچه که انتظار دارند را داشته باشد.
حاشیه خطای قابل قبول
ریسکی را که محقق در مطالعه قبول میکند معمولا خطای حاشیهای یا دقت مطالعه نامیده میشود. قانون کلی مرتبط با حاشیه قابل قبول خطا یا دقت در تحقیقات به این صورت است که برای دادههای کیفی و طبقهبندی شده 5% خطا مورد قبول است و برای داده های کمی و پیوسته 3% خطای حاشیه ای قابل قبول است. بعنوان مثال خطای حاشیهای 3% منجر به این میگردد که محقق اطمینان داشته باشد میانگین واقعی یک مقیاس لیکرت 7 تایی در فاصله 0/21± میانگین محاسبه شده از نمونه تحقیق قرار دارد. برای یک متغیردوگانه حاشیه 5% خطا ممکن است منجر به اطمینان این گردد که نسبت پاسخ دهندگانی که مرد بودند فاصله ای برابر با 5%± نسبت محاسبه شده از نمونه واقعی تحقیق دارد. حاشیه خطا ممکن است بالاتر (در صورت عدم وجود مشکل) و یا کمتر (دقت بالاتر مورد نیاز) از مقادیری که در بالا ذکر گردید تعیین گردد.
سطح آلفا
سطح آلفا که به وسیله محقق تعیین میگردد. سطح آلفا در فرمول کوکران در واقع سطح قابل قبول مخاطره ای است که حاشیه خطای صحیح از حاشیه خطای قابل قبول تخطی مینماید. به زبان سادهتر با استفاده از سطح آلفا محقق تعیین مینماید که تفاوت مشاهده شده در تجزیه و تحلیل آماری به چه صورت است و با چه سطح اطمینانی واقعا وجود ندارد. اسم دیگر سطح آلفا خطای نوع یک میباشد که در تعیین حجم نمونه در اکثر مطالعات تحقیقاتی برابر با 0/01 و یا 0/05 تعیین میگردد.
در فرمول کوکران سطح آلفا در فرمول به وسیله جدول مقادیر آماره توزیع نرمال استاندارد (Z) تعیین میگردد. بیشترین سطح مورد استفاده آلفا در مطالعات برابر با 0/05 (به معنای سطح اطمینان 97/5 %) است و تعداد کمی در مطالعات از سطح 0/1 (سطح اطمینان 95%)و یا 0/01 (سطح اطمینان 99/5%) استفاده مینمایند. سطح 0/1 زمانی در نظر گرفته میشود که محقق علاقهمند به شناسایی روابط حاشیهای، تفاوتها و یا سایر پدیدههای آماری است که به عنوان مقدمه مطالعات بیشتر و پسین انجام میگیرد. سطح آلفای 0/01 نیز ممکن است در مواردی استفاده گردد که تصمیمات مبتنی بر تحقیق حیاتی میباشد و اشتباهات ممکن است باعث صدمه جدی مالی و یا جانی شود(که معمولا در کارآزماییهای بالینی مورد استفاده قرار میگیرد) .
برآورد واریانس یا نسبت
یکی دیگر از مولقههای ضروری فرمولهای حجم نمونه در مواردی که میانگین و پراکندگی یک صفت یا ویژگی مد نظر محقق است برآورد واریانس یا نسبت در متغیرهای اولیه مورد نظر در مطالعات است. محققین کنترل مستقیمی بر واریانس ندارند و باید برآوردهای واریانس را در طراحی مطالعه در نظر بگیرند. کوکران 4 روش برای برآورد واریانس یا نسبت صفت مورد بررسی جامعه پیشنهاد داده است. این 4 روش به شرح زیر میباشند.
- جمع آوری نمونهها در دو گام میباشد. پس از کسب نتایج در گام اول و به دست آوردن مقدار واریانس، برای کسب حجم نمونه مناسب بر اساس واریانس مشاهده شده در گام دوم تصمیم خواهیم گرفت.
- انجام مطالعه پایلوت (این روش همانند روش بالاست با این تفاوت که در مطالعه پایلوت حجم نمونه بسیار کمتری از گام اول در روش اول مورد نیاز است).
- استفاده از نتایج مطالعات قبلی که در جوامع مشابه انجام شده است(واریانس یا نسبت صفت مورد نظر در مطالعات مشابه قبلی)
- برآورد و یا حدس ساختار جمعیتی با استفاده از برخی نتایج منطقی ریاضی.
سه روش اول منطقی هستند و پروسه های معتبری برای برآورد واریانس میباشند و بنابراین نیاز به بحث ندارند. اگر چه در بسیاری از تحقیقات استفاده از یکی از سه روش اول ممکن و شدنی نمیباشد و محقق باید واریانس را با استفاده از روش چهارم برآورد نماید.
اگر متغیر مهم و مورد بررسی در یک مطالعه متغیری کیفی باشد یک راه برای تعیین واریانس آن بدین صورت است که بعنوان مثال اگر از سوالات طیف لیکرت استفاده نمودهاید و میخواهید نتایج مطالعه شما 98% (سه برابر انحراف معیار را در اطراف میانگین یا 6 انحراف معیار به صورت کلی ) تمامی پاسخ دهندهها را در برگیرد، محاسبه انحراف معیار برابر با تقسیم 7 بر 6 میشود. هنگامی که انحراف معیار را برای متغیرهای دوگانه میخواهیم برآورد نماییم همانند جنسیت توصیه میگردد که محققین باید از مقدار 0/5 بعنوان برآوردی از نسبت جامعه استفاده نمایند. این برآورد باعث میشود که حداکثر حجم نمونه برای مطالعه در نظر گرفته شود. این نسبت میتواند به عنوان واریانس یا نسبت جامعه نامعلوم در نظر گرفته شود.
تعیین حجم نمونه پایه با استفاده از فرمول کوکران بر اساس ماهیت متغیر
فرمول کوکران برای محاسبه حجم نمونه بر اساس ماهیت انواع متغیرها در مطالعات پژوهشی ارائه گردیده است، که بر اساس گسسته یا پیوسته متغیر، متفاوت میباشد. در ادامه به تفصیل هر یک را بیان خواهیم نمود.
فرمول کوکران برای دادههای پیوسته
قبل از اینکه حجم نمونه و محاسبات مربوط به آنرا در نظر بگیریم، فرض کنید که دادههای مطالعه دارای ماهیت مقیاسی و پیوسته باشند. محقق باید تعیین نماید که آیا متغیرهای کیفی نقش اصلی را در تحلیل بازی میکنند یا خیر. اگر اینچنین باشد فرمولهای حجم نمونه کیفی باید استفاده گردد. در غیر اینصورت فرمول حجم نمونه برای دادههای کمی باید استفاده گردد. فرمول حجم نمونه برای دادههای کمی به صورت زیر میباشد
که در این فرمول هر یک از موارد به صورت زیر است
n = تعداد نمونه مورد نیاز برای انجام طرح
Z= مقدار آماره هم ارز مقدار سطح زیر منحنی نرمال استاندارد
α=احتمال خطای نوع اول
σ= نسبت فراوانی صفت مورد نظر در جامعه هدف
d= اندازه اثر یا دقت
با استفاده از این فرمول براحتی حجم نمونه در مطالعات با دادههای پیوسته قابل محاسبه است. در هنگام محاسبه حجم نمونه حتما باید ریزش موارد نمونه در مطالعه را در نظر گرفت.برای در نظر گرفتن ریزش(منظور عدم پاسخ فرد یا بی اعتبار بودن جوابدهی فرد میباشد)، اگر از پرسشنامههای استفاده میکنید که با ایمیل ارسال شده اند باید بین 40 تا 50 درصد ریزش در مطالعه را در نظر بگیرید. اما اگر از پرسشنامههای کاغذی استفاده میکنید بین 10 تا 20 درصد ریزش را در نظر بگیرید.
منظور از در نظر گرفتن ریزش اضافه نمودن این مقادیر به حجم نمونه تعیین شده میباشد. بعنوان مثال اگر حجم نمونه تعیین شده با استفاده از فرمول بالا برابر با 500 باشد و شما از پرسشنامه کاغذی استفاده مینمایید، با در نظر گرفتن 20% ریزش در مطالعه باید تعداد 600 نمونه جمع آوری نمایید. اگر چه این افزایش حجم نمونه باعث افزایش هزینه و زمان میگردد اما برای مطالعه لازم و ضروری میباشد.
علاوه بر این کوکران بیان نمود که به علت اینکه با استفاده از فرمول کوکران بخش کوچکی از جامعه انتخاب میگردد مقدار واریانس صفت مورد بررسی در جامعه نیز بزرگتر میگردد و این در نظر گرفتن جمعآوری اضافه نمونه به علت این است که ما به حداقل نمونه مورد نیاز در مطالعه دست یابیم.
فرمول کوکران برای دادههای کیفی یا طبقهبندی شده
فرمول کوکران مورد استفاده برای داده های کیفی همانند دادههای کمی میباشد با این تفاوت که در این فرمول به جای استفاده از واریانس در جامعه از نسبت صفت و ویژگی مورد نظر در جامعه استفاده مینماییم. فرمول حجم نمونه برای دادههای کیفی و طبقهبندی شده به صورت زیر است
که در این فرمول هر یک از موارد به صورت زیر است
n = تعداد نمونه مورد نیاز برای انجام طرح
Z= مقدار آماره هم ارز مقدار سطح زیر منحنی نرمال استاندارد
α=احتمال خطای نوع اول
p= نسبت فراوانی صفت مورد نظر در جامعه هدف
d= اندازه اثر یا دقت
پس از تعیین مقادیر هر یک از موارد بالا براحتی میتوانید فرمول کوکران را برای محاسبه حجم نمونه برای دادههای طبقهبندی شده یا کیفی استفاده نمایید.
فرض کنید که مطالعهای را بر روی ساکنین یک شهر بزرگ انجام میدهیم و میخواهیم بدانیم که چند نفر از آنهایی که خانه دارند صبحانه را در منزل میخورند. ما در مورد این موضوع اطلاعات چندانی را نداریم بنابراین فرض میکنیم که نصف جامعه این شهر صبحانه را در منزل خود میخورند( با فرض اینکه نصف جامعه مورد نظر صفت یا ویژگی مورد بررسی ما را دارا میباشند، در نظر گرفتن نصف جامعه باعث میشود که حجم نمونه ماکزیمم به دست آید و ماکزیمم تغییرپذیری در نظر گرفته شود. بنابراین نسبت یا همان p را برابر با 0/5 در نظر میگیریم. حال میخواهیم که 95% اطمینان بعلاوه و منهای 5% دقت را در نظر بگیریم. مقدار Z به دست آمده برای اطمینان 95% از جدول Z برابر با 1/96 میباشد. بنابراین حجم نمونه مورد نیاز به صورت زیر محاسبه میگردد.
بنابراین نمونه ای تصادفی از 385 فرد در جامعه هدف به نظر برای سطح اطمینان 95% که ما نیاز داریم کافی میباشد.
فرمول کوکران در پایان نامه
یکی ازدغدغههایی که دانشجویان در روند انجام پایاننامه با آن روبرو میشوند تعیین حجم نمونه در بخش متدلوژی پایان نامه است. در صورتی که متغیر مورد بررسی در عنوان پایاننامه به صورت پیوسته یا گسسته باشد با استفاده از فرمول کوکران که در بالا ذکر گردید میتوانید حجم نمونه را در مطالعه خود مشخص نموده و از رفرنسهایی که در پایان این مقاله برای شما قرار داده شده است برای رفرنس دهی فرمول حجم نمونه استفاده نمایید.
فرمول کوکران برای جامعه نامحدود
در شرایطی که حجم جامعه نامحدود باشد، از حجم نمونه محاسبه شده به وسیله فرمول کوکران برای متغیرهای پیوسته و گسسته که در بالاتر ذکر گردید استفاده مینماییم. بنابراین در شرایطی که حجم جامعه نامحدود است فرمول کوکران همانند قبل میباشد.
در غیر اینصورت و اگر حجم جامعه محدود و معلوم باشد حجم تعیین شده به وسیله فرمول کوکران را تا حدودی میتوان کاهش داد. این کاهش به دلیل این واقعیت است که جامعه بزرگتر به نسبت اطلاعات بیشتری از جامعه کوچکتر فراهم میآورد. کوکران برای جوامع محدود فرمولی با عنوان فرمول تصحیح حجم نمونه را ارائه داده است که با استفاده از آن میتوان حجم نمونه نهایی را در جوامع محدود محاسبه نمود.
در مواردی که حجم جامعه مورد بررسی محدود و قابل شناسایی باشد با استفاده از فرمول تصحیح حجم نمونه برای جامعه محدود میتوان حجم نمونه را در مطالعه اصلاح نمود. نکته ای که باید در این قسمت مد نظر قرار دهیم این هست که اگر حجم نمونه محاسبه شده با استفاده از فرمول کوکران از 5% حجم جامعه معلوم مورد بررسی فراتر رود، باید از فرمول تصحیح حجم نمونه کوکران برای محاسبه حجم نمونه نهایی در مطالعه استفاده گردد. اگر حجم نمونه محاسبه شده به وسیله فرمول کوکران از 5% حجم کل جامعه فراتر نرود نیازی به استفاده از این فرمول تصحیح حجم نمونه نمیباشد. فرمول تصحیح حجم نمونه به صورت زیر میباشد.
که در این فرمول هر یک از موارد به صورت زیر است
n0 = حجم نمونه به دست آمده به وسیله فرمول کوکران
N= حجم جامعه هدف
n= حجم نمونه اصلاح شده جدید
بعنوان مثال اگر در مثال بالا که حجم نمونه به دست آمده برابر با 385 بود حجم کل جامعه برابر با 1000 باشد، به دلیل اینکه 385 برابراست با نسبت 38/5% از حجم کل جامعه مورد بررسی و اینکه از 5% حجم جامعه مورد بررسی فراتر رفته است،
بنابراین از فرمول تصحیح حجم نمونه استفاده مینماییم. با استفاده از فرمول تصحیح حجم نمونه، حجم نهایی برای مطالعه برابر با 278 نمونه خواهد بود. همانطور که ملاحظه میگردد حجم نمونه تصحیح شده بسیار کمتر از حجم نمونه تعیین شده به وسیله فرمول کوکران میباشد.
جدول کوکران
جدول زیر که به جدول کوکران معروف است حجم نمونه برای جوامع مختلف با مقادیر مختلف سطح اطمینان را ارائه میدهد که مقادیر به دست آمده در این جدول بر اساس فرمول کوکران بدست آمده است. این جدول شامل حجم نمونه برای دادههای پیوسته و گسسته میباشد. حاشیه خطای در نظر گرفته شده برای دادههای پیوسته برابر با 0/03 و برای دادههای کیفی و گسسته برابر با 0/05 در نظر گرفته شده است.
اگر محقق حاشیه خطایی غیر از موارد در این جدول مد نظرش باشد باید با استفاده از فرمولهای ارائه شده آنرا محاسبه نمایند.
نتیجهگیری
فرمول کوکران در مطالعات پژوهشی یکی از فرمولهای پرکاربرد برای تعیین حجم نمونه میباشد. کوکران در سال 1977 در کتاب خود فرمولهای کوکران برای تعیین حجم نمونه دادههای پیوسته و گسسته را ارائه داده است. از جمله موارد بسیار مهمی که در استفاده از این فرمولهای باید در نظر گرفت ماهیت متغیر مهم و مورد بررسی در مطالعه میباشد. در مواردی که حجم جامعه معلوم باشد و حجم نمونه تعیین شده از 5% حجم جامعه فراتر رود میتوان از فرمول تصحیح حجم نمونه کوکران برای جوامع محدود استفاده کرد. استفاده از این فرمول باعث میگردد که تا حدودی حجم نمونه نهایی در مطالعه کاهش یابد.
در صورتی که حجم جامعه مورد بررسی معلوم باشد و بخواهید از حاشیه خطا 0/03 برای دادههای پیوسته و یا حاشیه خطا 0/05 برای دادههای گسسته در تعیین حجم نمونه استفاده نمایید، میتوانید از جدول کوکران برای محاسبه حجم نمونه استفاده نمایید.
در پایان باید این نکته را مد نظر قرار دهید که فرمول کوکران یکی از هزاران فرمول مورد استفاده در تعیین حجم نمونه در مطالعات میباشد و برای برآورد علمی و دقیق حجم نمونه با توجه به نوع مطالعه، شاخصهای مورد بررسی، در نظر گرفتن منابع مالی و انسانی و نیز ابزار مورد استفاده، از متخصصین آماری جهت تعیین حجم نمونه در مطالعه استفاده نمایید. در پایان اگر این مقاله برایتان مفید بوده است میتوانید نظراتتان را در این مورد در کامنتها بیان نمایید.
References
1-Cochran, William G. “1977Sampling techniques.”
2-Importance of the size of sample and its determination in the context of data related to the schools of Guwahati” which was published in the Bulletin of the Gauhati University Mathematics Association Vol. 12, 2012
3-An investigation on effect of bias on determination of sample size on the basis of data related to the students of schools of Guwahati” which was published in the International Journal of Applied Mathematics and Statistical Sciences Vol. 2, Issue 1,2013
4-Israel, Glenn D. “Determining sample size.” (1992): 2017.
5-Kotrlik, J. W. K. J. W., and C. C. H. C. C. Higgins. “Organizational research: Determining appropriate sample size in survey research appropriate sample size in survey research.” Information technology, learning, and performance journal 19, no. 1 (2001): 43.