فرمول کوکران و انواع آن در مطالعات پژوهشی

فرمول کوکران

در مطالعات مختلف پس از جمع آوری داده‌ها و اطلاعات، اصلی‌ترین هدف بدست آوردن استنباط‌هایی درباره جامعه است که به وسیله تحلیل آماری این داده‌ها انجام میگیرد. یکی از مهم‌ترین سوالاتی است که در پروسه انجام یک مطالعه توسط محققین پرسیده می‌شود این است که چند نمونه برای تعمیم نتایج مطالعه به جامعه نیاز داریم. یکی از روشهای تعیین حجم نمونه در مطالعات کمی، فرمول کوکران می‌باشد. اگر حجم نمونه به درستی انتخاب نشود نتایجی که از نمونه به دست می آید قابل تعمیم به جامعه هدف نمی‌باشد.

آنچه در این مطلب می خوانید

هدف نهایی در اکثر مطالعات کمی استنباط نتایج و تعمیم آن به کل جامعه هدفی می‌باشد که نمونه‌ها از آن جمع‌آوری گردیده است. استنباط حاصله از نمونه‌ها مرتبط با برخی از پارامترهای جامعه همانند میانگین، انحراف معیار و یا برخی دیگر از جزئیات همانند نسبت یک صفت یا ویژگی در جامعه می‌باشد. اما سوال واقعی اینجاست که چه تعداد نمونه باید جمع آوری گردد تا بتوانیم نتایج را به جامعه هدف تعمیم دهیم. فرمول کوکران تا حدودی به این سوال پاسخ می‌دهد.

ویلیام کوکران در سال 1977 کتابی با عنوان تکنیک‌های نمونه گیری را ارائه داد و فرمول‌هایی که امروزه با عنوان فرمول کوکران می‌شناسیم برگرفته از کتاب تکنیک‌های نمونه‌گیری می‌باشد که در آن انواع روشهای نمونه‌گیری و نیزتعیین حجم نمونه را بیان نموده است. فرمول‌های کوکران برای مطالعات مختلف با متغیرهای پیوسته و گسسته ارائه گردیده است.

فرمول کوکران به شما امکان انتخاب حجم نمونه را با توجه به دقت دلخواه، سطح اطمینان مطلوب و نسبت یا میانگین برآورد شده از ویژگی صفت مورد نظر در جامعه را می‌دهد. با توجه به اینکه فرمول کوکران برای داده‌های پیوسته و گسسته متفاوت می‌باشد، قبل از اینکه بتوانیم حجم نمونه را در یک مطالعه تعیین نماییم لازم است که آشنایی اولیه با مبانی تعیین حجم نمونه در مطالعات پژوهشی و یا مواردی که برای تعیین حجم نمونه با استفاده از فرمول کوکران لاز است را باید بدانیم.

مبانی تعیین حجم نمونه

تعیین حجم نمونه در یک مطالعه مبانی مختلفی دارد که از آن جمله می‌توان به متغیرهای اولیه اندازه‌گیری، برآورد خطا، سطح آلفا، حاشیه خطای قابل قبول و برآورد واریانس یا نسبت اشاره نمود.

متغیرهای اولیه اندازه گیری

اینکه چه متغیری را برای قرارگیری در فرمول تعیین حجم نمونه قرار دهیم از مبانی تعیین حجم نمونه می‌باشد. بعنوان مثال اگر محقق قصد دارد که از یک گزینه 7 مقیاسی برای رضایت شغلی استفاده کند و همچنین در نظر دارد که پاسخ دهندگان مختلفی بر حسب یک متغیر کیفی همانند جنسیت، سطح تحصیلات و … در نظر بگیرد، اینکه کدام متغیر باید بعنوان مبنای حجم نمونه در نظر گرفته شود یک سوال اساسی است.

این سوال به دلیل این اهمیت دارد که بعنوان مثال در نظر گرفتن یک متغیر به عنوان متغیر شاخص همانند جنسیت می‌تواند موجب حجم نمونه بزرگتری در مقایسه با سایر متغیرها همانند متغیر 7 مقیاسی بعنوان متغیر شاخص گردد.

کوکران در سال 1977 به حل این مشکل پرداخت. این مشکل از نظر وی از طریق در نظر گرفتن حاشیه‌های خطا برای آیتم‌هایی است که بعنوان حیاتی‌ترین متغیرها در مطالعه در نظر گرفته می‌شوند، قابل حل است. در واقع باید برای هر متغیر مهم و حیاتی به صورت جداگانه حجم نمونه برآورد شود. با اینکار حجم نمونه‌های (n) مختلفی به دست می‌آید که حجم نمونه‌های کمتر معمولا مربوط به متغیرهای مقیاس‌بندی شده و پیوسته است و حجم نمونه‌های بالا معمولا مربوط به متغیرهای کیفی یا دوگانه می‌باشد.

محقق می‌تواند تصمیم بگیرد که اگر n برای متغیرهای مورد نظر تا حدودی نزدیک به یکدیگر باشد می‌تواند به سادگی از n بزرگتر به عنوان حجم نمونه استفاده نماید و اطمینان داشته باشد که اطلاعات به دست آمده بر حسب نمونه تعیین شده نتایج قابل قبول را ارائه دهد.

اما معمولا تفاوت کافی بین n ها ی به دست آمده بر اساس متغیرهای مختلف وجود دارد اما محققین اکثرا ترجیح می‌دهند که حجم نمونه کمتر را انتخاب نمایند که می‌تواند دلایلی همچون در نظر گرفتن منابع مالی در مطالعه و یا به دلیل اینکه این حجم نمونه میتواند دقت استاندارد بیشتر از نیاز آنچه که  انتظار دارند را داشته باشد.

حاشیه خطای قابل قبول

ریسکی را که محقق در مطالعه قبول می‌کند معمولا خطای حاشیه‌ای یا دقت مطالعه نامیده می‌شود. قانون کلی مرتبط با حاشیه قابل قبول خطا یا دقت در تحقیقات به این صورت است که برای داده‌های کیفی و طبقه‌بندی شده 5% خطا مورد قبول است و برای داده های کمی و پیوسته 3% خطای حاشیه ای قابل قبول است. بعنوان مثال خطای حاشیه‌ای 3% منجر به این می‌گردد که محقق اطمینان داشته باشد میانگین واقعی یک مقیاس لیکرت 7 تایی در فاصله 0/21± میانگین محاسبه شده از نمونه تحقیق قرار دارد. برای یک متغیردوگانه حاشیه 5% خطا ممکن است منجر به اطمینان این گردد که نسبت پاسخ دهندگانی که مرد بودند فاصله ای برابر با 5%± نسبت محاسبه شده از نمونه واقعی تحقیق دارد. حاشیه خطا ممکن است بالاتر (در صورت عدم وجود مشکل) و یا کمتر (دقت بالاتر مورد نیاز) از مقادیری که در بالا ذکر گردید تعیین گردد.

سطح آلفا

سطح آلفا که به وسیله محقق تعیین می‌گردد. سطح آلفا در فرمول کوکران در واقع سطح قابل قبول مخاطره ای است که حاشیه خطای صحیح از حاشیه خطای قابل قبول تخطی می‌نماید. به زبان ساده‌تر با استفاده از سطح آلفا محقق تعیین می‌نماید که تفاوت مشاهده شده در تجزیه و تحلیل آماری به چه صورت است و با چه سطح اطمینانی واقعا وجود ندارد. اسم دیگر سطح آلفا خطای نوع یک می‌باشد که در تعیین حجم نمونه در اکثر مطالعات تحقیقاتی برابر با 0/01 و یا 0/05 تعیین می‌گردد.

در فرمول کوکران سطح آلفا در فرمول به وسیله جدول مقادیر آماره توزیع نرمال استاندارد (Z) تعیین می‌گردد. بیشترین سطح مورد استفاده آلفا در مطالعات برابر با 0/05 (به معنای سطح اطمینان 97/5 %) است و تعداد کمی در مطالعات از سطح 0/1 (سطح اطمینان 95%)و یا 0/01 (سطح اطمینان 99/5%) استفاده می‌نمایند. سطح 0/1 زمانی در نظر گرفته می‌شود که محقق علاقه‌مند به شناسایی روابط حاشیه‌ای، تفاوت‌ها و یا سایر پدیده‌های آماری است که به عنوان مقدمه مطالعات بیشتر و پسین انجام می‌گیرد. سطح آلفای 0/01 نیز ممکن است در مواردی استفاده گردد که تصمیمات مبتنی بر تحقیق حیاتی می‌باشد و اشتباهات ممکن است باعث صدمه جدی مالی و یا جانی شود(که معمولا در کارآزمایی‌های بالینی مورد استفاده قرار می‌گیرد) .

برآورد واریانس یا نسبت

یکی دیگر از مولقه‌های ضروری فرمول‌های حجم نمونه در مواردی که میانگین و پراکندگی یک صفت یا ویژگی مد نظر محقق است برآورد واریانس یا نسبت در متغیرهای اولیه مورد نظر در مطالعات است. محققین کنترل مستقیمی بر واریانس ندارند و باید برآوردهای واریانس را در طراحی مطالعه در نظر بگیرند. کوکران 4 روش برای برآورد واریانس یا نسبت صفت مورد بررسی جامعه پیشنهاد داده است. این 4 روش به شرح زیر می‌باشند.

  1. جمع آوری نمونه‌ها در دو گام می‌باشد. پس از کسب نتایج در گام اول و به دست آوردن مقدار واریانس، برای کسب حجم نمونه مناسب بر اساس واریانس مشاهده شده در گام دوم تصمیم خواهیم گرفت.
  2. انجام مطالعه پایلوت  (این روش همانند روش بالاست با این تفاوت که در مطالعه پایلوت حجم نمونه بسیار کمتری از گام اول در روش اول مورد نیاز است).
  3. استفاده از نتایج مطالعات قبلی که در جوامع مشابه انجام شده است(واریانس یا نسبت صفت مورد نظر در مطالعات مشابه قبلی)
  4. برآورد و یا حدس ساختار جمعیتی با استفاده از برخی نتایج منطقی ریاضی.

سه روش اول منطقی هستند و پروسه های معتبری برای برآورد واریانس می‌باشند و بنابراین نیاز به بحث ندارند. اگر چه در بسیاری از تحقیقات استفاده از یکی از سه روش اول ممکن و شدنی نمی‌باشد و محقق باید واریانس را با استفاده از روش چهارم برآورد نماید.

اگر متغیر مهم و مورد بررسی در یک مطالعه متغیری کیفی باشد یک راه برای تعیین واریانس آن بدین صورت است که بعنوان مثال اگر از سوالات طیف لیکرت استفاده نموده‌اید و می‌خواهید نتایج مطالعه شما 98%  (سه برابر انحراف معیار را در اطراف میانگین یا 6 انحراف معیار به صورت کلی ) تمامی پاسخ دهنده‌ها را در برگیرد، محاسبه انحراف معیار برابر با تقسیم 7 بر 6 می‌شود. هنگامی که انحراف معیار را برای متغیرهای دوگانه می‌خواهیم برآورد نماییم همانند جنسیت توصیه می‌گردد که محققین باید از مقدار 0/5 بعنوان برآوردی از نسبت جامعه استفاده نمایند. این برآورد باعث می‌شود که حداکثر حجم نمونه برای مطالعه در نظر گرفته شود. این نسبت می‌تواند به عنوان واریانس یا نسبت جامعه نامعلوم در نظر گرفته شود.

تعیین حجم نمونه پایه با استفاده از فرمول کوکران بر اساس ماهیت متغیر

فرمول کوکران برای محاسبه حجم نمونه بر اساس ماهیت انواع متغیرها در مطالعات پژوهشی ارائه گردیده است، که بر اساس گسسته یا پیوسته متغیر، متفاوت می‌باشد. در ادامه به تفصیل هر یک را بیان خواهیم نمود.

فرمول کوکران برای داده‌های پیوسته

قبل از اینکه حجم نمونه و محاسبات مربوط به آنرا در نظر بگیریم، فرض کنید که داده‌های مطالعه دارای ماهیت مقیاسی و پیوسته باشند. محقق باید تعیین نماید که آیا متغیرهای کیفی نقش اصلی را در تحلیل بازی میکنند یا خیر. اگر این‌چنین باشد فرمول‌های حجم نمونه کیفی باید استفاده گردد. در غیر اینصورت فرمول حجم نمونه برای داده‌های کمی باید استفاده گردد. فرمول حجم نمونه برای داده‌های کمی به صورت زیر می‌باشد

فرمول کوکران برای متغیرهای پیوسته با استفاده از واریانس در مطالعه محاسبه میگردد.
فرمول کوکران برا ی متغیرهای پیوسته

که در این فرمول هر یک از موارد به صورت زیر است

n = تعداد نمونه مورد نیاز برای انجام طرح

 Z= مقدار آماره هم ارز مقدار سطح زیر منحنی نرمال استاندارد

 α=احتمال خطای نوع اول

 σ= نسبت فراوانی صفت مورد نظر در جامعه هدف

 d= اندازه اثر یا دقت

با استفاده از این فرمول براحتی حجم نمونه در مطالعات با داده‌های پیوسته قابل محاسبه است. در هنگام محاسبه حجم نمونه حتما باید ریزش موارد نمونه در مطالعه را در نظر گرفت.برای در نظر گرفتن ریزش(منظور عدم پاسخ فرد یا بی اعتبار بودن جوابدهی فرد می‌باشد)، اگر از پرسشنامه‌های استفاده می‌کنید که با ایمیل ارسال شده اند باید بین 40 تا 50 درصد ریزش در مطالعه را در نظر بگیرید. اما اگر از پرسشنامه‌های کاغذی استفاده می‌کنید بین 10 تا 20 درصد ریزش را در نظر بگیرید.

منظور از در نظر گرفتن ریزش اضافه نمودن این مقادیر به حجم نمونه تعیین شده می‌باشد. بعنوان مثال اگر حجم نمونه تعیین شده با استفاده از فرمول بالا برابر با 500 باشد و شما از پرسشنامه کاغذی استفاده می‌نمایید، با در نظر گرفتن 20% ریزش در مطالعه باید تعداد 600 نمونه جمع آوری نمایید.  اگر چه این افزایش حجم نمونه باعث افزایش هزینه و زمان می‌گردد اما برای مطالعه لازم و ضروری می‌باشد.

 علاوه بر این کوکران بیان نمود که به علت اینکه با استفاده از فرمول کوکران بخش کوچکی از جامعه انتخاب می‌گردد مقدار واریانس صفت مورد بررسی در جامعه نیز بزرگتر می‌گردد و این در نظر گرفتن جمع‌آوری اضافه نمونه به علت این است که ما به حداقل نمونه مورد نیاز در مطالعه دست یابیم.

فرمول کوکران برای داده‌های کیفی یا طبقه‌بندی شده

فرمول کوکران مورد استفاده برای داده های کیفی همانند داده‌های کمی می‌باشد با این تفاوت که در این فرمول به جای استفاده از واریانس در جامعه از نسبت صفت و ویژگی مورد نظر در جامعه استفاده می‌نماییم. فرمول حجم نمونه برای داده‌های کیفی و طبقه‌بندی شده به صورت زیر است

فرمول کوکران برای داده های گسسته و طبقه بندی شده که با استفاده از آن میتوان حجم نمونه را تعیین نمود.
فرمول کوکران برای داده های گسسته و طبقه بندی شده

که در این فرمول هر یک از موارد به صورت زیر است

n = تعداد نمونه مورد نیاز برای انجام طرح

 Z= مقدار آماره هم ارز مقدار سطح زیر منحنی نرمال استاندارد

 α=احتمال خطای نوع اول

 p= نسبت فراوانی صفت مورد نظر در جامعه هدف

 d= اندازه اثر یا دقت

پس از تعیین مقادیر هر یک از موارد بالا براحتی می‌توانید فرمول کوکران را برای محاسبه حجم نمونه برای داده‌های طبقه‌بندی شده یا کیفی استفاده نمایید.

فرض کنید که مطالعه‌ای را بر روی ساکنین یک شهر بزرگ انجام می‌دهیم و می‌خواهیم بدانیم که چند نفر از آنهایی که خانه دارند صبحانه را در منزل می‌خورند. ما در مورد این موضوع اطلاعات چندانی را نداریم بنابراین فرض میکنیم که نصف جامعه این شهر صبحانه را در منزل خود می‌خورند( با فرض اینکه نصف جامعه مورد نظر صفت یا ویژگی  مورد بررسی ما را دارا می‌باشند، در نظر گرفتن نصف جامعه باعث می‌شود که حجم نمونه ماکزیمم به دست آید و ماکزیمم تغییرپذیری در نظر گرفته شود. بنابراین نسبت یا همان p را برابر با 0/5 در نظر می‌گیریم. حال می‌خواهیم که 95% اطمینان بعلاوه و منهای 5% دقت را در نظر بگیریم. مقدار Z به دست آمده برای اطمینان 95% از جدول Z برابر با 1/96 می‌باشد. بنابراین حجم نمونه مورد نیاز به صورت زیر محاسبه می‌گردد.

مثالی از فرمول کوکران برای داده های گسسته و طبقه بندی شده است که در آن از حداکثر مقدار نسبت در مطالعه استفاده گردیده است.
مثال فرمول کوکران برای متغیر گسسته یا طبقه بندی شده

  بنابراین نمونه ای تصادفی از 385 فرد در جامعه هدف به نظر برای سطح اطمینان 95% که ما نیاز داریم کافی می‌باشد.

فرمول کوکران در پایان نامه

یکی ازدغدغه‌هایی که دانشجویان در روند انجام پایان‌نامه با آن روبرو می‌شوند تعیین حجم نمونه در بخش متدلوژی پایان نامه است. در صورتی که متغیر مورد بررسی در عنوان پایان‌نامه به صورت پیوسته یا گسسته باشد با استفاده از فرمول کوکران که در بالا ذکر گردید می‌توانید حجم نمونه را در مطالعه خود مشخص نموده و از رفرنسهایی که در پایان این مقاله برای شما قرار داده شده است برای رفرنس دهی فرمول حجم نمونه استفاده نمایید.

فرمول کوکران برای جامعه نامحدود

در شرایطی که حجم جامعه نامحدود باشد، از حجم نمونه محاسبه شده به وسیله فرمول کوکران برای متغیرهای پیوسته و گسسته که در بالاتر ذکر گردید استفاده می‌نماییم. بنابراین در شرایطی که حجم جامعه نامحدود است فرمول کوکران همانند قبل می‌باشد.

در غیر اینصورت و اگر حجم جامعه محدود و معلوم باشد حجم تعیین شده به وسیله فرمول کوکران را تا حدودی می‌توان کاهش داد. این کاهش به دلیل این واقعیت است که جامعه بزرگتر به نسبت اطلاعات بیشتری از جامعه کوچکتر فراهم می‌آورد. کوکران برای جوامع محدود فرمولی با عنوان فرمول تصحیح حجم نمونه را ارائه داده است که با استفاده از آن می‌توان حجم نمونه نهایی را در جوامع محدود محاسبه نمود.

در مواردی که حجم جامعه مورد بررسی محدود و قابل شناسایی باشد با استفاده از فرمول تصحیح حجم نمونه برای جامعه محدود می‌توان حجم نمونه را در مطالعه اصلاح نمود. نکته ای که باید در این قسمت مد نظر قرار دهیم این هست که اگر حجم نمونه محاسبه شده با استفاده از فرمول کوکران از 5% حجم جامعه معلوم مورد بررسی فراتر رود، باید از فرمول تصحیح حجم نمونه کوکران برای محاسبه حجم نمونه نهایی در مطالعه استفاده گردد. اگر حجم نمونه محاسبه شده به وسیله فرمول کوکران از 5% حجم کل جامعه فراتر نرود نیازی به استفاده از این فرمول تصحیح حجم نمونه نمی‌باشد. فرمول تصحیح حجم نمونه به صورت زیر می‌باشد.

فرمول کوکران در مواردی نیاز به تصحیح دارد که با استفاده از فرمول تصحیح حجم نمونه میتوان حجم نمونه  مورد نظر را تصحیح نماییم.
فرمول تصحیح کوکران برای جامعه محدود

که در این فرمول هر یک از موارد به صورت زیر است

n0 = حجم نمونه به دست آمده به وسیله فرمول کوکران

 N= حجم جامعه هدف

 n= حجم نمونه اصلاح شده جدید

بعنوان مثال اگر در مثال بالا که حجم نمونه به دست آمده برابر با 385 بود حجم کل جامعه برابر با 1000 باشد، به دلیل اینکه 385 برابراست با نسبت 38/5% از حجم کل جامعه مورد بررسی و اینکه از 5% حجم جامعه مورد بررسی فراتر رفته است،

کاهش حجم نمونه در مطالعات
مثال استفاده از فرمول تصحیح حجم نمونه برای کاهش نمونه در جامعه محدود

بنابراین از فرمول تصحیح حجم نمونه استفاده می‌نماییم. با استفاده از فرمول تصحیح حجم نمونه، حجم نهایی برای مطالعه برابر با 278 نمونه خواهد بود. همانطور که ملاحظه می‌گردد حجم نمونه‌ تصحیح شده بسیار کمتر از حجم نمونه تعیین شده به وسیله فرمول کوکران می‌باشد.

جدول کوکران

جدول زیر که به جدول کوکران معروف است حجم نمونه برای جوامع مختلف با مقادیر مختلف سطح اطمینان را ارائه می‌دهد که مقادیر به دست آمده در این جدول بر اساس فرمول کوکران بدست آمده است. این جدول شامل حجم نمونه برای داده‌های پیوسته و گسسته می‌باشد. حاشیه خطای در نظر گرفته شده برای داده‌های پیوسته برابر با 0/03 و برای داده‌های کیفی و گسسته برابر با 0/05 در نظر گرفته شده است.

جدول کوکران برای محاسبه حجم نمونه

اگر محقق حاشیه خطایی غیر از موارد در این جدول مد نظرش باشد باید با استفاده از فرمول‌های ارائه شده آنرا محاسبه نمایند.

نتیجه‌گیری

فرمول کوکران در مطالعات پژوهشی یکی از فرمول‌های پرکاربرد برای تعیین حجم نمونه می‌باشد. کوکران در سال 1977 در کتاب خود فرمول‌های کوکران برای تعیین حجم نمونه داده‌های پیوسته و گسسته را ارائه داده است. از جمله موارد بسیار مهمی که در استفاده از این فرمول‌های باید در نظر گرفت ماهیت متغیر مهم و مورد بررسی در مطالعه می‌باشد. در مواردی که حجم جامعه معلوم باشد و حجم نمونه تعیین شده از 5% حجم جامعه فراتر رود می‌توان از فرمول تصحیح حجم نمونه کوکران برای جوامع محدود استفاده کرد. استفاده از این فرمول باعث می‌گردد که تا حدودی حجم نمونه نهایی در مطالعه کاهش یابد.

در صورتی که حجم جامعه مورد بررسی معلوم باشد و بخواهید از حاشیه خطا 0/03 برای داده‌های پیوسته و یا حاشیه خطا 0/05 برای داده‌های گسسته در تعیین حجم نمونه استفاده نمایید، می‌توانید از جدول کوکران برای محاسبه حجم نمونه استفاده نمایید.

در پایان باید این نکته را مد نظر قرار دهید که فرمول کوکران یکی از هزاران فرمول مورد استفاده در تعیین حجم نمونه در مطالعات می‌باشد و برای برآورد علمی و  دقیق حجم نمونه با توجه به نوع مطالعه، شاخص‌های مورد بررسی، در نظر گرفتن منابع مالی و انسانی و نیز ابزار مورد استفاده، از متخصصین آماری جهت تعیین حجم نمونه در مطالعه استفاده نمایید. در پایان اگر این مقاله برایتان مفید بوده است می‌توانید نظراتتان را در این مورد در کامنت‌ها بیان نمایید.

References

1-Cochran, William G. “1977Sampling techniques.”

2-Importance of the size of sample and its determination in the context of data related to the schools of Guwahati” which was published in the Bulletin of the Gauhati University Mathematics Association Vol. 12, 2012

3-An investigation on effect of bias on determination of sample size on the basis of data related to the students of schools of Guwahati” which was published in the International Journal of Applied Mathematics and Statistical Sciences Vol. 2, Issue 1,2013

4-Israel, Glenn D. “Determining sample size.” (1992): 2017.

5-Kotrlik, J. W. K. J. W., and C. C. H. C. C. Higgins. “Organizational research: Determining appropriate sample size in survey research appropriate sample size in survey research.” Information technology, learning, and performance journal 19, no. 1 (2001): 43.