ما هو قيمة الاحتمال (P-Value)؟
قيمة الاحتمال، أو p-value، هي رقم يصف احتمالية الحصول على البيانات الملاحظة تحت الفرضية الصفرية لاختبار إحصائي.
تُستخدم قيمة p كبديل لنقاط الرفض لتوفير أصغر مستوى من الأهمية الذي يمكن عنده رفض الفرضية الصفرية. تعني قيمة p الأصغر وجود دليل أقوى لصالح الفرضية البديلة.
النقاط الرئيسية
- القيمة الاحتمالية (p-value) هي مقياس إحصائي يُستخدم للتحقق من صحة فرضية مقابل البيانات الملاحظة.
- يقيس قيمة الاحتمال (p-value) احتمال الحصول على النتائج الملاحظة، بافتراض أن الفرضية الصفرية صحيحة.
- كلما كان مستوى الاحتمالية (p-value) أقل، زادت الأهمية الإحصائية للاختلاف الملحوظ.
- يُعتبر عادةً أن قيمة p-value التي تساوي 0.05 أو أقل ذات دلالة إحصائية.
- يمكن أن تكون قيمة P بديلاً أو إضافة إلى مستويات الثقة المحددة مسبقًا لاختبار الفرضيات.
ما هو استخدام القيمة الاحتمالية (P-Value)؟
غالبًا ما يُستخدم قيمة الاحتمال (P-value) لتعزيز مصداقية الدراسات من قبل العلماء والباحثين الطبيين وكذلك التقارير الصادرة عن الوكالات الحكومية. على سبيل المثال، ينص مكتب الإحصاء الأمريكي على أن أي تحليل بقيمة احتمال أكبر من 0.10 يجب أن يُرفق ببيان يفيد بأن الفرق ليس ذو دلالة إحصائية عن الصفر. كما أن مكتب الإحصاء لديه معايير تحدد القيم الاحتمالية المقبولة لمختلف المنشورات.
كيف يتم حساب قيمة P؟
عادةً ما يتم حساب القيم الاحتمالية (P-values) باستخدام برامج إحصائية أو جداول القيم الاحتمالية بناءً على توزيع الاحتمالات المفترض أو المعروف للإحصائية المحددة التي يتم اختبارها. بينما يؤثر حجم العينة على موثوقية البيانات الملاحظة، فإن نهج اختبار الفرضيات باستخدام القيم الاحتمالية يتضمن تحديدًا حساب القيمة الاحتمالية بناءً على الانحراف بين القيمة الملاحظة وقيمة مرجعية مختارة، مع الأخذ في الاعتبار توزيع الاحتمالات للإحصائية. وكلما زاد الفرق بين القيمتين، انخفضت القيمة الاحتمالية.
رياضيًا، يتم حساب قيمة p باستخدام حساب التكامل من المساحة تحت منحنى توزيع الاحتمالات لجميع قيم الإحصائيات التي تكون على الأقل بعيدة عن القيمة المرجعية مثلما تكون القيمة الملاحظة، وذلك بالنسبة إلى المساحة الكلية تحت منحنى توزيع الاحتمالات. الانحرافات المعيارية، التي تقيس تشتت نقاط البيانات عن المتوسط، تلعب دورًا أساسيًا في هذا الحساب.
يختلف حساب قيمة p بناءً على نوع الاختبار الذي يتم إجراؤه. تصف الأنواع الثلاثة للاختبارات الموقع على منحنى توزيع الاحتمالات: اختبار ذو ذيل سفلي، اختبار ذو ذيل علوي، أو اختبار ذو ذيلين. في كل حالة، تلعب درجات الحرية دورًا حاسمًا في تحديد شكل التوزيع وبالتالي حساب قيمة p.
باختصار، كلما زاد الفرق بين قيمتين ملاحظتين، قل احتمال أن يكون هذا الفرق ناتجًا عن الصدفة العشوائية البسيطة، وهذا ينعكس في قيمة p أقل.
ما هي أهمية قيمة P؟
تستخدم طريقة القيمة الاحتمالية (p-value) في اختبار الفرضيات الاحتمال المحسوب لتحديد ما إذا كانت هناك أدلة كافية لرفض الفرضية الصفرية. يعتمد هذا التحديد بشكل كبير على إحصائية الاختبار، التي تلخص المعلومات من العينة ذات الصلة بالفرضية التي يتم اختبارها. الفرضية الصفرية، والمعروفة أيضًا بالتخمين، هي الادعاء الأولي حول المجتمع (أو عملية توليد البيانات). بينما تنص الفرضية البديلة على ما إذا كان معلمة المجتمع تختلف عن قيمة معلمة المجتمع المذكورة في التخمين.
في الممارسة العملية، يتم تحديد مستوى الأهمية مسبقًا لتحديد مدى صغر قيمة p اللازمة لرفض الفرضية الصفرية. نظرًا لأن الباحثين المختلفين يستخدمون مستويات مختلفة من الأهمية عند فحص سؤال معين، قد يجد القارئ أحيانًا صعوبة في مقارنة النتائج من اختبارين مختلفين. توفر قيم p حلاً لهذه المشكلة.
كيفية تفسير قيمة p: حتى قيمة p المنخفضة ليست بالضرورة دليلًا على الأهمية الإحصائية، حيث لا يزال هناك احتمال أن تكون البيانات الملاحظة نتيجة للصدفة. فقط التجارب أو الدراسات المتكررة يمكنها تأكيد ما إذا كانت العلاقة ذات دلالة إحصائية.
على سبيل المثال، افترض أن دراسة مقارنة العوائد من أصلين معينين تم إجراؤها بواسطة باحثين مختلفين استخدموا نفس البيانات ولكن بمستويات دلالة مختلفة. قد يصل الباحثون إلى استنتاجات متناقضة بشأن ما إذا كانت الأصول تختلف.
إذا استخدم باحث واحد مستوى ثقة بنسبة 90% والآخر احتاج إلى مستوى ثقة بنسبة 95% لرفض الفرضية الصفرية، وإذا كانت قيمة p للاختلاف الملحوظ بين العائدين هي 0.08 (ما يعادل مستوى ثقة بنسبة 92%)، فإن الباحث الأول سيجد أن الأصلين لديهما اختلاف ذو دلالة إحصائية، بينما سيجد الثاني أنه لا يوجد اختلاف ذو دلالة إحصائية بين العائدات.
لتجنب هذه المشكلة، يمكن للباحثين الإبلاغ عن قيمة p للاختبار الفرضي والسماح للقراء بتفسير الأهمية الإحصائية بأنفسهم. يُطلق على هذا النهج اسم نهج قيمة p في اختبار الفرضيات. يمكن للمراقبين المستقلين ملاحظة قيمة p وتحديد ما إذا كانت تمثل فرقًا ذا دلالة إحصائية أم لا.
مثال على قيمة P
يدعي مستثمر أن أداء محفظته الاستثمارية يعادل أداء مؤشر ستاندرد آند بورز (S&P) 500. لتحديد ذلك، يقوم المستثمر بإجراء اختبار ثنائي الطرف.
تنص الفرضية الصفرية على أن عوائد المحفظة تعادل عوائد مؤشر S&P 500 خلال فترة محددة، بينما تنص الفرضية البديلة على أن عوائد المحفظة وعوائد مؤشر S&P 500 ليست متكافئة. إذا قام المستثمر بإجراء اختبار أحادي الطرف، فإن الفرضية البديلة ستنص على أن عوائد المحفظة إما أقل أو أكبر من عوائد مؤشر S&P 500.
اختبار الفرضية باستخدام قيمة p لا يتطلب بالضرورة استخدام مستوى ثقة محدد مسبقًا حيث يجب على المستثمر إعادة تعيين الفرضية الصفرية بأن العوائد متكافئة. بدلاً من ذلك، يوفر مقياسًا لمدى قوة الأدلة المتوفرة لرفض الفرضية الصفرية. كلما كانت قيمة p أصغر، كانت الأدلة ضد الفرضية الصفرية أقوى.
لذلك، إذا وجد المستثمر أن قيمة p هي 0.001، فهذا يشير إلى وجود دليل قوي ضد الفرضية الصفرية، ويمكن للمستثمر أن يستنتج بثقة أن عوائد المحفظة وعوائد مؤشر S&P 500 ليست متكافئة.
على الرغم من أن هذا لا يوفر حدًا دقيقًا لتحديد متى يجب على المستثمر قبول أو رفض الفرضية الصفرية، إلا أنه يقدم ميزة عملية أخرى. يوفر اختبار الفرضية باستخدام قيمة P طريقة مباشرة لمقارنة الثقة النسبية التي يمكن أن يتمتع بها المستثمر عند الاختيار بين أنواع متعددة من الاستثمارات أو المحافظ المختلفة مقارنةً بـ المؤشر المرجعي مثل S&P 500.
على سبيل المثال، بالنسبة لمحفظتين، A وB، تختلف أداؤهما عن مؤشر S&P 500 بقيم p تبلغ 0.10 و0.01 على التوالي، يمكن للمستثمر أن يكون أكثر ثقة بأن المحفظة B، ذات القيمة p الأقل، ستظهر بالفعل نتائج مختلفة بشكل مستمر.
هل قيمة P تساوي 0.05 تعتبر ذات دلالة إحصائية؟
عادةً ما يُعتبر أن قيمة p-value أقل من 0.05 ذات دلالة إحصائية، وفي هذه الحالة يجب رفض الفرضية الصفرية. أما إذا كانت قيمة p-value أكبر من 0.05، فهذا يعني أن الانحراف عن الفرضية الصفرية ليس ذا دلالة إحصائية، وبالتالي لا يتم رفض الفرضية الصفرية.
ماذا يعني قيمة P تساوي 0.001؟
قيمة p تساوي 0.001 تشير إلى أنه إذا كانت فرضية العدم المختبرة صحيحة بالفعل، فسيكون هناك احتمال واحد من بين 1,000 لملاحظة نتائج على الأقل بنفس الدرجة من التطرف. وهذا يدفع المراقب إلى رفض فرضية العدم لأن إما أن تكون النتيجة نادرة للغاية قد تم ملاحظتها أو أن فرضية العدم غير صحيحة.
كيف يمكنك استخدام قيمة P لمقارنة نتيجتين مختلفتين لاختبار فرضية؟
إذا كان لديك نتيجتان مختلفتان، إحداهما بقيمة p-value تساوي 0.04 والأخرى بقيمة p-value تساوي 0.06، فإن النتيجة ذات قيمة p-value تساوي 0.04 ستعتبر أكثر دلالة إحصائية من تلك التي بقيمة p-value تساوي 0.06. بالإضافة إلى هذا المثال المبسط، يمكنك مقارنة قيمة p-value تساوي 0.04 مع قيمة p-value تساوي 0.001. كلاهما ذو دلالة إحصائية، ولكن المثال الذي يحتوي على 0.001 يقدم حالة أقوى ضد الفرضية الصفرية من 0.04.
الخلاصة
يُستخدم قيمة p لقياس أهمية البيانات الملاحظة. عندما يحدد الباحثون علاقة ظاهرة بين متغيرين، هناك دائمًا احتمال أن يكون هذا الارتباط مجرد صدفة. تساعد حسابات قيمة p في تحديد ما إذا كانت العلاقة الملاحظة يمكن أن تنشأ نتيجة للصدفة.