عينة: ماذا تعني في الإحصائيات، الأنواع، والأمثلة

عينة: ماذا تعني في الإحصائيات، الأنواع، والأمثلة

(عينة : sample)

ما هو العينة؟

يشير مصطلح العينة إلى نسخة أصغر وأكثر قابلية للإدارة من مجموعة أكبر. إنها مجموعة فرعية تحتوي على خصائص مجموعة أكبر تُعرف بـالسكان. تُستخدم العينات في الاختبارات الإحصائية عندما تكون أحجام السكان كبيرة جدًا بحيث لا يمكن تضمين جميع الأعضاء أو الملاحظات الممكنة. يجب أن تمثل العينة السكان ككل وألا تعكس أي تحيز نحو سمة معينة.

هناك العديد من تقنيات العينة التي يستخدمها الباحثون والإحصائيون، ولكل منها فوائد وعيوب. لقد أصبحت مسألة العينة محط اهتمام رئيسي مع ظهور الذكاء الاصطناعي والبيانات التي يتم تدريبه عليها. الآن، يدور نقاش حاد حول ما إذا كانت العينة المستخدمة في البيانات المختارة لتدريب الذكاء الاصطناعي غير متحيزة تجاه بعض فئات المجتمع، أو بعض الجهات، أو بعض المعلومات، أو بعض الأفكار، أو بعض المناطق، وما إلى ذلك.

النقاط الرئيسية

  • تُستخدم العينة في الإحصائيات كجزء تحليلي من مجموعة سكانية أكبر.
  • استخدام العينات يسمح للباحثين بإجراء دراساتهم في الوقت المناسب مع بيانات أكثر قابلية للإدارة.
  • العينات المأخوذة بشكل عشوائي لا تحتوي على الكثير من التحيز إذا كانت كبيرة بما يكفي، ولكن تحقيق مثل هذه العينة قد يكون مكلفًا ويستغرق وقتًا طويلاً.
  • في العينة العشوائية البسيطة، يكون كل كيان في المجتمع متطابقًا، بينما تقسم العينة العشوائية الطبقية المجتمع الكلي إلى مجموعات أصغر.

فهم العينات

السكان هو العدد الإجمالي للملاحظات (أي الأفراد، الحيوانات، العناصر، البيانات، إلخ) الموجودة في مجموعة أو سياق معين. العينة هي جزء أو قسم أو كسر من المجموعة الكاملة، وتعمل كجزء فرعي من تلك السكان. تُستخدم العينات في مجموعة متنوعة من الإعدادات حيث يتم إجراء الأبحاث. العلماء، المسوقون، الوكالات الحكومية، الاقتصاديون، ومجموعات البحث هم من بين الذين يستخدمون العينات لدراساتهم وقياساتهم.

استخدام مجموعات سكانية كاملة في الأبحاث يأتي مع تحديات. قد يواجه الباحثون مشاكل في الوصول إلى مجموعات سكانية كاملة. وبسبب طبيعة بعض الدراسات، قد يواجه الباحثون صعوبات في الحصول على النتائج التي يحتاجونها في الوقت المناسب. لهذا السبب تُستخدم العينات. استخدام مجموعة أصغر لتمثيل المجموعة السكانية الكاملة يمكن أن ينتج عنه نتائج صالحة مع تقليل الوقت والموارد.

يجب أن تشبه العينات السكان الأوسع لإجراء استنتاجات أو تنبؤات دقيقة. يجب أن يشترك جميع المشاركين في العينة في نفس الخصائص والصفات. لذلك، إذا كانت الدراسة تتعلق بالطلاب الجدد في الكلية من الذكور، فيجب أن تكون العينة نسبة صغيرة من الذكور الذين يتناسبون مع هذا الوصف. وبالمثل، إذا قامت مجموعة بحثية بإجراء دراسة حول أنماط النوم للنساء العازبات فوق سن الخمسين، فيجب أن تشمل العينة فقط النساء ضمن هذه الفئة الديموغرافية.

اعتبارات خاصة

فكر في فريق من الباحثين الأكاديميين الذين يرغبون في معرفة عدد الطلاب الذين درسوا لأقل من 40 ساعة لامتحان CFA exam ونجحوا فيه. نظرًا لأن أكثر من 200,000 شخص يجرون الامتحان عالميًا كل عام، فإن التواصل مع كل مشارك في الامتحان سيستهلك الوقت والموارد.

في الواقع، بحلول الوقت الذي يتم فيه جمع وتحليل البيانات من السكان، قد تكون مرت بضع سنوات، مما يجعل التحليل عديم الفائدة لأن مجموعة سكانية جديدة قد تكون ظهرت. ما يمكن للباحثين فعله بدلاً من ذلك هو أخذ عينة ممثلة والحصول على البيانات من هذه العينة.

لتحقيق عينة غير متحيزة، يجب أن تكون عملية الاختيار عشوائية بحيث يكون لكل فرد من السكان فرصة متساوية ومحتملة للانضمام إلى مجموعة العينة. هذا يشبه سحب اليانصيب وهو الأساس لـ العينة العشوائية البسيطة.

العينة هي عدد غير متحيز من الملاحظات المأخوذة من مجتمع. للحصول على عينة غير متحيزة، يجب أن يكون الاختيار عشوائيًا بحيث يكون لكل فرد في المجتمع فرصة متساوية للانضمام إلى المجموعة.

طرق أخذ العينات

تشير طرق أخذ العينات إلى الطريقة التي يتم بها اختيار العينات من السكان العامين. يمكن للباحثين استخدام إحدى طريقتين لأخذ العينات لإجراء دراساتهم:

  • أخذ العينات الاحتمالية: لا يوجد اختيار متعمد في أخذ العينات الاحتمالية. لهذا السبب يُشار إليه أيضًا بأخذ العينات العشوائية. نظرًا لعدم وجود تحيز، يمكن أن يكون أخذ العينات الاحتمالية مستهلكًا للوقت وفي بعض الأحيان مكلفًا.
  • العينة غير الاحتمالية: الباحثون الذين يستخدمون هذه الطريقة في اختيار العينات يختارون عيناتهم بشكل متعمد. هذا يجعلها طريقة غير عشوائية في اختيار العينات. نظرًا لأنها ليست عشوائية، فإن جزءًا معينًا فقط من السكان لديه فرصة للمشاركة في الدراسة. يتم اختيار العينات بناءً على عوامل معينة، بما في ذلك الموقع أو الملاءمة.

أنواع أخذ العينات

الآن بعد أن تعرفت على طرق أخذ العينات، من المهم أن تفهم الأنواع المختلفة من أخذ العينات التي يمكن للإحصائيين والباحثين استخدامها. لقد أبرزنا بعض أنواع أخذ العينات أدناه.

العينة العشوائية البسيطة

العينة العشوائية البسيطة مثالية إذا كانت كل الكيانات في المجتمع متطابقة. إذا لم يهتم الباحثون بما إذا كانت عيناتهم تتكون من ذكور فقط أو إناث فقط أو مزيج من كلا الجنسين بأي شكل من الأشكال، فقد تكون العينة العشوائية البسيطة تقنية اختيار جيدة.

لنفترض أن 200,000 شخص تقدموا لامتحان CFA في عام 2021، منهم 40% نساء و60% رجال. لذلك، يجب أن تحتوي العينة العشوائية المأخوذة من السكان على 400 امرأة و600 رجل ليصبح المجموع 1,000 شخص تقدموا للامتحان.

العينة المنتظمة

العينة المنتظمة هي شكل من أشكال العينة الاحتمالية. مشابهة للعينة العشوائية البسيطة، تتضمن اختيار عينات عشوائية ضمن فاصل زمني دوري ثابت. يقوم الباحثون بحساب الفاصل الزمني عن طريق قسمة إجمالي السكان على حجم العينة المطلوب.

على عكس العينة العشوائية البسيطة، فإن العينة النظامية أكثر كفاءة من حيث الوقت والتكلفة. كما أن هناك خطر أقل لتلاعب البيانات.

يُفضل استخدام هذا النوع من أخذ العينات عندما:

  • هناك بعض الترتيب في السكان.
  • عندما يكون حجم السكان كبيرًا ومعروفًا، خاصة عندما تكون الموارد والوقت محدودين.
  • عندما يتم توزيع العينة بشكل متساوٍ عبر السكان

العينة العشوائية الطبقية

ولكن ماذا عن الحالات التي يكون فيها معرفة نسبة الرجال إلى النساء الذين اجتازوا اختبارًا بعد الدراسة لأقل من 40 ساعة أمرًا مهمًا؟ هنا، سيكون من الأفضل استخدام عينة عشوائية طبقية stratified random sample بدلاً من عينة عشوائية بسيطة.

هذا النوع من أخذ العينات، المعروف أيضًا باسم أخذ العينات العشوائي النسبي أو أخذ العينات العشوائي بالحصص، يقسم إجمالي السكان إلى مجموعات أصغر. تُعرف هذه المجموعات بالطبقات. الأفراد داخل الطبقات يشتركون في خصائص متشابهة.

ماذا لو كان العمر عاملاً مهماً أراد الباحثون تضمينه في بياناتهم؟ باستخدام تقنية العينة العشوائية الطبقية، يمكنهم إنشاء طبقات أو شرائح لكل فئة عمرية. يجب أن يكون الاختيار عشوائياً بحيث يكون لكل شخص في الفئة فرصة متساوية ليتم تضمينه.

على سبيل المثال، هناك مشاركان، أليكس وديفيد، يبلغان من العمر 22 و24 عامًا على التوالي. لا يمكن لعملية اختيار العينة أن تفضل أحدهما على الآخر بناءً على آلية تفضيلية معينة. يجب أن يكون لديهما فرصة متساوية ليتم اختيارهما من مجموعتهما العمرية. يمكن أن تبدو الطبقات كما يلي:

الطبقات (العمر)

عدد الأشخاص في المجتمع

العدد الذي سيتم تضمينه في العينة

20-24

تحليل النسب المالية

20. نسبة السيولة السريعة

نسبة السيولة السريعة هي مقياس للقدرة على تغطية الالتزامات قصيرة الأجل دون الحاجة إلى بيع المخزون. يتم حسابها باستخدام المعادلة التالية:

نسبة السيولة السريعة = (الأصول المتداولة - المخزون) / الخصوم المتداولة

21. نسبة السيولة الجارية

نسبة السيولة الجارية تقيس قدرة الشركة على سداد التزاماتها قصيرة الأجل باستخدام أصولها المتداولة. يتم حسابها باستخدام المعادلة التالية:

نسبة السيولة الجارية = الأصول المتداولة / الخصوم المتداولة

22. نسبة الدين إلى حقوق الملكية

نسبة الدين إلى حقوق الملكية تقيس مدى اعتماد الشركة على التمويل بالدين مقارنة بحقوق الملكية. يتم حسابها باستخدام المعادلة التالية:

نسبة الدين إلى حقوق الملكية = إجمالي الدين / إجمالي حقوق الملكية

23. معدّل دوران رأس المال (Turnover)

معدّل دوران رأس المال (Turnover) هو مقياس لمدى كفاءة الشركة في استخدام رأس المال العامل لتوليد المبيعات. يتم حسابه باستخدام المعادلة التالية:

معدّل دوران رأس المال (Turnover) = المبيعات / رأس المال العامل

24. العائد على الأصول (ROA)

العائد على الأصول (ROA) يقيس مدى كفاءة الشركة في استخدام أصولها لتوليد الأرباح. يتم حسابه باستخدام المعادلة التالية:

العائد على الأصول (ROA) = صافي الربح / إجمالي الأصول

٣٠,٠٠٠

150

25-29

٧٠,٠٠٠

350

٣٠-٣٤

٤٠,٠٠٠

200

٣٥-٣٩

٣٠,٠٠٠

150

40-44

٢٠,٠٠٠

100

٤٤

١٠,٠٠٠

50

الإجمالي

٢٠٠,٠٠٠

١,٠٠٠

من الجدول، تم تقسيم السكان إلى مجموعات عمرية. على سبيل المثال، 30,000 شخص ضمن الفئة العمرية من 20 إلى 24 عامًا خضعوا لامتحان CFA في عام 2021. باستخدام نفس النسبة، سيكون لدى مجموعة العينة (30,000 ÷ 200,000) × 1,000 = 150 شخصًا يخضعون للاختبار ضمن هذه المجموعة. قد يكون أليكس أو ديفيد - أو كلاهما أو لا أحد منهما - ضمن 150 مشاركًا عشوائيًا في الامتحان من العينة.

هناك العديد من الطبقات الأخرى التي يمكن تجميعها عند اتخاذ قرار بشأن حجم العينة. قد يقوم بعض الباحثين بتعبئة وظائف العمل، والدول، والحالة الاجتماعية، وما إلى ذلك، للأشخاص الذين سيخضعون للاختبار عند اتخاذ قرار حول كيفية إنشاء العينة.

العينة العنقودية

العينة العنقودية هي شكل من أشكال العينة العشوائية. تُعرّف العنقوديات على أنها مجموعات فرعية مختلفة من السكان الأكبر. العينات الفردية داخل العنقودية تتمتع بخصائص متشابهة. يُستخدم العينة العنقودية بشكل شائع عندما تكون هناك مجموعات سكانية كبيرة منتشرة، مما يجعل دراسة كل موضوع مكلفة وتستغرق وقتًا طويلاً.

هناك بعض الخطوات لأخذ العينات العنقودية:

  1. فهم وتحديد الفئة السكانية التي يتم دراستها.
  2. إنشاء المجموعة. يعني ذلك تقسيم السكان بالكامل إلى مجموعات واختيار عينات عشوائية من تلك المجموعات للدراسة.
  3. اختر العينة من المجموعات.
  4. يقوم الباحثون بإجراء دراستهم من خلال مقابلة العينات. بمجرد الانتهاء من ذلك، يتم جمع البيانات وتحليلها.

كما هو مذكور أعلاه، يمكن أن يوفر أخذ العينات العنقودية الوقت والمال. ومع ذلك، هناك بعض العيوب لاستخدام هذا النوع من أخذ العينات. على سبيل المثال، قد يكون الباحثون متحيزين عند اختيارهم للعناقيد والعينات. وبالتالي، قد لا تمثل العينات بدقة السكان بشكل عام.

أمثلة على العينات

في عام 2022، كان عدد سكان العالم يقارب 7.95 مليار نسمة، منهم 49.7% إناث و50% ذكور. يمكن أن يكون العدد الإجمالي للأشخاص في أي بلد معين هو حجم السكان. يمكن اعتبار العدد الإجمالي للطلاب في مدينة ما كسكان، وكذلك العدد الإجمالي للكلاب في مدينة هو أيضًا حجم السكان. يمكن أخذ عينات من هذه المجموعات السكانية لأغراض البحث.

وفقًا لمثال امتحان CFA لدينا، يمكن للباحثين أخذ عينة من 1,000 مشارك في امتحان CFA من إجمالي 200,000 من المتقدمين للاختبار—وهو ما يمثل المجتمع—وتشغيل البيانات المطلوبة على هذا العدد. سيتم أخذ متوسط هذه العينة لتقدير متوسط المتقدمين لامتحان CFA الذين اجتازوا الامتحان رغم أنهم درسوا لأقل من 40 ساعة.

يجب أن تكون العينة المأخوذة غير متحيزة. هذا يعني أنه إذا كان متوسط العينة لـ 1,000 مشارك في امتحان CFA هو 50، فيجب أن يكون متوسط المجتمع لـ 200,000 من المتقدمين للاختبار أيضًا حوالي 50.

لماذا يستخدم المحللون العينات بدلاً من قياس المجتمع بأكمله؟

غالبًا ما تكون المجموعة السكانية كبيرة جدًا أو واسعة النطاق بحيث يصعب قياس كل عضو فيها، كما أن قياس كل عضو سيكون مكلفًا ويستغرق وقتًا طويلاً. يتيح استخدام العينة إجراء استنتاجات حول المجموعة السكانية باستخدام الأساليب الإحصائية.

ما هو العينة العشوائية البسيطة؟

تستخدم هذه الطريقة في أخذ العينات المستجيبين أو نقاط البيانات التي يتم اختيارها عشوائيًا من المجتمع الأكبر. مع حجم عينة كبير بما فيه الكفاية، يزيل العينة العشوائية التحيز.

لماذا تسمح العينات العشوائية بالاستدلال؟

تشير قوانين الإحصاء إلى أنه يمكن إجراء قياسات وتقييمات دقيقة حول مجتمع معين باستخدام عينة. تعتبر تحليل التباين (ANOVA)، والانحدار الخطي، وتقنيات النمذجة المتقدمة الأخرى صالحة بسبب قانون الأعداد الكبيرة ونظرية الحد المركزي.

ما هو حجم العينة الذي تحتاجه؟

سيعتمد ذلك على حجم السكان ونوع التحليل الذي ترغب في القيام به (مثل فترات الثقة التي تستخدمها). تحليل القوة هو تقنية لتقييم حجم العينة الأصغر المطلوب بناءً على احتياجاتك بشكل رياضي. قاعدة أخرى عامة هي أن تكون عينتك كبيرة بما يكفي، ولكن لا تزيد عن 10% من حجم السكان.

الخلاصة

يمكن أن يساعدنا أخذ العينات في فهم الفروق الدقيقة في المجموعات السكانية الكبيرة. إنها وسيلة فعّالة من حيث التكلفة للباحثين لدراستها مع توفير الوقت. نظرًا لصعوبة دراسة المجموعات الكبيرة، يستخدم المسوقون والعلماء والحكومات والباحثون الآخرون مجموعات فرعية أصغر - تُعرف بالعينات - لتحليلها واتخاذ قرارات مهمة.