ما هو فاصل الثقة وكيف يمكنك حسابه؟

ما هو فاصل الثقة وكيف يمكنك حسابه؟

(فاصل الثقة : Confidence Interval)

تعريف

يشير فاصل الثقة إلى احتمال أن يقع معلم المجتمع بين مجموعة من القيم لنسبة معينة من المرات.

يشير فاصل الثقة في الإحصاءات إلى احتمال أن يقع معلم من معالم السكان بين مجموعة من القيم لنسبة معينة من المرات. غالبًا ما يستخدم المحللون فواصل الثقة التي تحتوي إما على 95% أو 99% من الملاحظات المتوقعة. وبالتالي، إذا تم توليد تقدير نقطي من نموذج إحصائي بقيمة 10.00 مع فاصل ثقة 95% يتراوح بين 9.50 و10.50، فهذا يعني أن هناك ثقة بنسبة 95% أن القيمة الحقيقية تقع ضمن هذا النطاق.

يستخدم الإحصائيون والمحللون الآخرون فترات الثقة لفهم الدلالة الإحصائية لتقديراتهم أو استنتاجاتهم أو توقعاتهم. إذا احتوت فترة الثقة على قيمة الصفر (أو بعض فرضية العدم)، فلا يمكن الادعاء بشكل مرضٍ بأن نتيجة من البيانات الناتجة عن الاختبار أو التجريب تُعزى إلى سبب محدد بدلاً من الصدفة.

النقاط الرئيسية

  • يعرض فاصل الثقة احتمال وقوع معلمة بين زوج من القيم حول المتوسط.
  • تقيس فترات الثقة درجة عدم اليقين أو اليقين في طريقة أخذ العينات.
  • تُستخدم أيضًا في اختبار الفرضيات وتحليل الانحدار.
  • غالبًا ما يستخدم الإحصائيون القيم الاحتمالية (p-values) جنبًا إلى جنب مع فترات الثقة لتقييم الأهمية الإحصائية.
  • غالبًا ما يتم إنشاؤها باستخدام مستويات ثقة تبلغ 95% أو 99%.

فهم الفواصل الزمنية للثقة

تُقاس فترات الثقة بدرجة عدم اليقين أو اليقين في طريقة العينة. يمكن أن تأخذ أي عدد من حدود الاحتمال، مع كون الأكثر شيوعًا هو مستوى ثقة 95% أو 99%. تُجرى فترات الثقة باستخدام الأساليب الإحصائية، مثل اختبار t-test.

الإحصائيون يستخدمون فترات الثقة لقياس عدم اليقين في تقدير معلمة مجتمع بناءً على عينة. على سبيل المثال، يقوم الباحث باختيار عينات مختلفة عشوائيًا من نفس المجتمع ويحسب فترة الثقة لكل عينة ليرى كيف يمكن أن تمثل القيمة الحقيقية لمتغير المجتمع. وتكون مجموعات البيانات الناتجة مختلفة؛ حيث تتضمن بعض الفترات المعلمة الحقيقية للمجتمع بينما لا تتضمنها الأخرى.

فترة الثقة هي نطاق من القيم، محصور أعلى وأسفل المتوسط الإحصائي، الذي من المحتمل أن يحتوي على معلمة غير معروفة للسكان. يشير مستوى الثقة إلى نسبة الاحتمال، أو اليقين، بأن فترة الثقة ستحتوي على المعلمة الحقيقية للسكان عند سحب عينة عشوائية عدة مرات.

أو، بالعامية، "نحن متأكدون بنسبة 99% (مستوى الثقة) أن معظم هذه العينات (فترات الثقة) تحتوي على المعلمة الحقيقية للمجتمع."

أكبر مفهوم خاطئ يتعلق بفترات الثقة هو الاعتقاد بأنها تمثل النسبة المئوية للبيانات من عينة معينة التي تقع بين الحدود العليا والسفلى. على سبيل المثال، قد يفسر البعض بشكل خاطئ فترة الثقة بنسبة 99% التي تتراوح بين 70 إلى 78 بوصة على أنها تشير إلى أن 99% من البيانات في عينة عشوائية تقع بين هذه الأرقام.

هذا غير صحيح، على الرغم من وجود طريقة منفصلة للتحليل الإحصائي لتحديد ذلك. يتضمن القيام بذلك تحديد متوسط العينة والانحراف المعياري ورسم هذه الأرقام على منحنى الجرس bell curve.

فترة الثقة ومستوى الثقة مرتبطان ببعضهما البعض ولكن ليسا متطابقين تمامًا. يمكنك الاطلاع على المزيد حول مستوى الثقة من خلال هذا الرابط.

حساب فترات الثقة

افترض أن مجموعة من الباحثين تدرس أطوال لاعبي كرة السلة في المدارس الثانوية. يأخذ الباحثون عينة عشوائية من السكان ويحددون متوسط الطول ليكون 74 بوصة.

المتوسط البالغ 74 بوصة هو تقدير نقطي لمتوسط المجتمع. يعتبر التقدير النقطي بمفرده ذو فائدة محدودة لأنه لا يكشف عن عدم اليقين المرتبط بالتقدير؛ ليس لديك فكرة جيدة عن مدى بُعد هذا المتوسط البالغ 74 بوصة عن متوسط المجتمع. ما ينقص هنا هو درجة عدم اليقين في هذه العينة الفردية.

توفر فترات الثقة معلومات أكثر من التقديرات النقطية. من خلال إنشاء فترة ثقة بنسبة 95% باستخدام متوسط العينة والانحراف المعياري، وافتراض وجود توزيع طبيعي كما هو ممثل في منحنى الجرس، يصل الباحثون إلى حد أعلى وحد أدنى يحتويان على المتوسط الحقيقي بنسبة 95% من الوقت.

افترض أن النطاق يتراوح بين 72 بوصة و76 بوصة. إذا أخذ الباحثون 100 عينة عشوائية من مجتمع لاعبي كرة السلة في المدارس الثانوية ككل، يجب أن يقع المتوسط بين 72 و76 بوصة في 95 من تلك العينات.

إذا أراد الباحثون الحصول على ثقة أكبر، يمكنهم توسيع النطاق إلى مستوى ثقة بنسبة 99%. القيام بذلك يؤدي دائمًا إلى إنشاء نطاق أوسع، حيث يتيح المجال لعدد أكبر من متوسطات العينات. إذا حددوا نطاق الثقة بنسبة 99% ليكون بين 70 بوصة و78 بوصة، يمكنهم توقع أن تحتوي 99 من كل 100 عينة مقيمة على قيمة متوسطة بين هذين الرقمين.

من ناحية أخرى، فإن مستوى الثقة بنسبة 90% يعني أنك تتوقع أن تشمل 90% من تقديرات الفترات المعلمة السكانية، وهكذا.

ماذا يكشف فاصل الثقة؟

فترة الثقة هي نطاق من القيم، محصور فوق وتحت متوسط الإحصائية، من المحتمل أن يحتوي على معلمة مجتمع غير معروفة. يشير مستوى الثقة إلى نسبة الاحتمال، أو اليقين، بأن فترة الثقة ستحتوي على معلمة المجتمع الحقيقية عند سحب عينة عشوائية عدة مرات.

لماذا تُستخدم فترات الثقة؟

يستخدم الإحصائيون فترات الثقة لقياس عدم اليقين في متغير العينة. على سبيل المثال، يقوم الباحث باختيار عينات مختلفة بشكل عشوائي من نفس المجتمع ويحسب فترة الثقة لكل عينة ليرى كيف يمكن أن تمثل القيمة الحقيقية لمتغير المجتمع. وتكون مجموعات البيانات الناتجة مختلفة حيث تتضمن بعض الفترات المعلمة الحقيقية للمجتمع بينما لا تتضمنها الأخرى.

ما هو المفهوم الخاطئ الشائع حول فترات الثقة؟

أكبر مفهوم خاطئ حول فترات الثقة هو الاعتقاد بأنها تمثل النسبة المئوية للبيانات من عينة معينة التي تقع بين الحدود العليا والسفلى. بمعنى آخر، سيكون من الخطأ افتراض أن فترة الثقة بنسبة 99% تعني أن 99% من البيانات في عينة عشوائية تقع بين هذه الحدود. ما تعنيه فعليًا هو أنه يمكن أن يكون لديك يقين بنسبة 99% أن هذا النطاق سيحتوي على المتوسط السكاني.

ما هو اختبار T؟

يتم إجراء فترات الثقة باستخدام الأساليب الإحصائية، مثل اختبار t. اختبار t هو نوع من الإحصائيات الاستدلالية المستخدمة لتحديد ما إذا كان هناك فرق كبير بين متوسطات مجموعتين، والتي قد تكون مرتبطة بميزات معينة. يتطلب حساب اختبار t ثلاثة قيم بيانات رئيسية. وتشمل هذه الفرق بين القيم المتوسطة من كل مجموعة بيانات (المعروفة باسم الفرق المتوسط)، والانحراف المعياري لكل مجموعة، وعدد قيم البيانات لكل مجموعة.

كيف تفسر القيم الاحتمالية (P-Values) وفترات الثقة (Confidence Intervals)؟

القيمة الاحتمالية p-value هي قياس إحصائي يُستخدم للتحقق من صحة فرضية مقابل البيانات الملاحظة، حيث تقيس احتمال الحصول على النتائج الملاحظة بافتراض أن الفرضية الصفرية صحيحة. بشكل عام، تُعتبر القيمة الاحتمالية أقل من 0.05 ذات دلالة إحصائية، وفي هذه الحالة يجب رفض الفرضية الصفرية. يمكن أن يتوافق هذا إلى حد ما مع احتمال أن تكون قيمة الفرضية الصفرية (التي غالبًا ما تكون صفرًا) موجودة ضمن فترة ثقة بنسبة 95%.

الخلاصة

فترات الثقة تتيح للمحللين فهم مدى احتمال أن تكون نتائج التحليلات الإحصائية حقيقية أو ناتجة عن الصدفة. عند محاولة إجراء استنتاجات أو توقعات بناءً على عينة من البيانات، سيكون هناك بعض الشك حول ما إذا كانت نتائج هذا التحليل تتوافق بالفعل مع السكان الحقيقيين الذين يتم دراستهم. تمثل فترة الثقة النطاق المحتمل الذي يجب أن تقع فيه القيمة الحقيقية.