الأهمية الإحصائية: التعريف، الأنواع، وكيفية حسابها

الأهمية الإحصائية: التعريف، الأنواع، وكيفية حسابها

(الأهمية الإحصائية : statistical significance)

ما هو الدلالة الإحصائية؟

تشير الدلالة الإحصائية إلى الادعاء بأن مجموعة من البيانات الملاحظة ليست نتيجة للصدفة، بل يمكن نسبها إلى سبب محدد. تعتبر الدلالة الإحصائية مهمة للتخصصات الأكاديمية أو الممارسين الذين يعتمدون بشكل كبير على تحليل البيانات والبحث، مثل الاقتصاد، التمويل، الاستثمار، الطب، الفيزياء، وعلم الأحياء.

يمكن اعتبار الأهمية الإحصائية قوية أو ضعيفة. عند تحليل مجموعة بيانات وإجراء الاختبارات اللازمة لتحديد ما إذا كان متغير أو أكثر يؤثر على النتيجة، فإن الأهمية الإحصائية القوية تساعد في دعم حقيقة أن النتائج حقيقية وليست ناتجة عن الحظ أو الصدفة. ببساطة، إذا كانت قيمة p صغيرة، فإن النتيجة تعتبر أكثر موثوقية.

النقاط الرئيسية

  • يشير الدلالة الإحصائية إلى الادعاء بأن نتيجة من البيانات الناتجة عن الاختبار أو التجربة من المحتمل أن تُعزى إلى سبب محدد.
  • يشير مستوى عالٍ من الأهمية الإحصائية إلى أن العلاقة الملاحظة من غير المحتمل أن تكون نتيجة للصدفة.
  • حساب الأهمية الإحصائية يكون عرضة لدرجة معينة من الخطأ.
  • يمكن أن يُساء تفسير الأهمية الإحصائية عندما لا يستخدم الباحثون اللغة بعناية عند الإبلاغ عن نتائجهم.
  • تُستخدم عدة أنواع من اختبارات الأهمية اعتمادًا على البحث الذي يتم إجراؤه.

تظهر المشاكل في اختبارات الدلالة الإحصائية لأن الباحثين عادةً ما يعملون مع عينات من مجموعات سكانية أكبر وليس مع المجموعات السكانية نفسها. ونتيجة لذلك، يجب أن تكون العينات ممثلة للمجموعة السكانية، لذا يجب ألا تكون البيانات الموجودة في العينة متحيزة بأي شكل من الأشكال. في معظم العلوم، بما في ذلك الاقتصاد، يمكن اعتبار النتيجة ذات دلالة إحصائية إذا كان لديها مستوى ثقة بنسبة 95% (أو أحيانًا 99%).

فهم الأهمية الإحصائية

حساب الأهمية الإحصائية (اختبار الأهمية) يخضع لدرجة معينة من الخطأ. حتى إذا بدت البيانات وكأنها تمتلك علاقة قوية، يجب على الباحثين أن يأخذوا في الاعتبار إمكانية أن يكون الارتباط الظاهر قد نشأ بسبب الصدفة العشوائية أو خطأ في أخذ العينات.

حجم العينة هو عنصر مهم في الأهمية الإحصائية، حيث أن العينات الأكبر تكون أقل عرضة للصدف. يجب استخدام العينات العشوائية المختارة بعناية، مثل العينات التمثيلية، في اختبار الأهمية. المستوى الذي يمكن عنده قبول ما إذا كان الحدث ذو أهمية إحصائية يُعرف بمستوى الأهمية.

يستخدم الباحثون مقياسًا يُعرف باسم القيمة الاحتمالية (p-value) لتحديد الأهمية الإحصائية؛ إذا كانت القيمة الاحتمالية أقل من مستوى الأهمية، فإن النتيجة تكون ذات دلالة إحصائية. القيمة الاحتمالية هي دالة تعتمد على المتوسطات والانحرافات المعيارية لعينات البيانات.

تشير قيمة p إلى الاحتمالية التي حدثت فيها النتيجة الإحصائية المعطاة، بافتراض أن الصدفة وحدها هي المسؤولة عن النتيجة. إذا كانت هذه الاحتمالية صغيرة، يمكن للباحث أن يستنتج أن هناك عاملاً آخر قد يكون مسؤولاً عن البيانات الملاحظة.

المعكوس لمستوى الدلالة، الذي يُحسب على أنه 1 ناقص مستوى الدلالة، هو مستوى الثقة. يشير إلى درجة الثقة بأن النتيجة الإحصائية لم تحدث بالصدفة أو بسبب خطأ في أخذ العينات. مستوى الثقة المعتاد في العديد من الاختبارات الإحصائية هو 95%، مما يؤدي إلى مستوى دلالة أو قيمة p المعتادة بنسبة 5%.

اعتبارات خاصة

الدلالة الإحصائية لا تشير دائمًا إلى الأهمية العملية، مما يعني أن النتائج قد لا تكون قابلة للتطبيق في مواقف الأعمال الواقعية. بالإضافة إلى ذلك، يمكن أن يتم تفسير الدلالة الإحصائية بشكل خاطئ عندما لا يستخدم الباحثون اللغة بعناية عند الإبلاغ عن نتائجهم. حقيقة أن النتيجة ذات دلالة إحصائية لا تعني أنها ليست نتيجة للصدفة، بل فقط أن هذا الاحتمال أقل.

مجرد أن يكون هناك ارتباط قوي بين سلسلتين من البيانات لا يعني بالضرورة وجود علاقة سببية. على سبيل المثال، عدد الأفلام التي يشارك فيها الممثل نيكولاس كيج في سنة معينة يرتبط بشكل كبير بعدد حالات الغرق العرضية في حمامات السباحة. لكن هذا الارتباط هو زائف لأنه لا يمكن تقديم ادعاء سببي نظري.

مشكلة أخرى قد تنشأ مع الأهمية الإحصائية هي أن البيانات السابقة، والنتائج المستخلصة من تلك البيانات - سواء كانت ذات دلالة إحصائية أم لا - قد لا تعكس الظروف الحالية أو المستقبلية. في مجال الاستثمار، قد يظهر ذلك في انهيار نموذج التسعير خلال أوقات الأزمات المالية حيث تتغير الارتباطات ولا تتفاعل المتغيرات كما هو معتاد. يمكن للأهمية الإحصائية أيضًا أن تساعد المستثمر في التمييز بين ما إذا كان نموذج تسعير الأصول أفضل من آخر.

أنواع اختبارات الدلالة الإحصائية

تُستخدم عدة أنواع من اختبارات الأهمية اعتمادًا على البحث الذي يتم إجراؤه. على سبيل المثال، يمكن استخدام الاختبارات لعينة واحدة أو عينتين أو أكثر من البيانات ذات الأحجام المختلفة للأوساط، أو التباينات، أو النسب، أو البيانات المزدوجة أو غير المزدوجة، أو التوزيعات المختلفة للبيانات.

هناك أيضًا طرق مختلفة لاختبار الأهمية، وذلك اعتمادًا على نوع البيانات المتاحة. يُنسب إلى رونالد فيشر صياغة واحدة من أكثر الطرق مرونة، بالإضافة إلى تحديد معيار الأهمية عند p < 0.05. نظرًا لأن معظم العمل يمكن القيام به بعد جمع البيانات بالفعل، فإن هذه الطريقة تظل شائعة في المشاريع البحثية قصيرة الأجل أو العشوائية.

سعيًا للبناء على طريقة فيشر، قام جيرزي نيمان وإيجون بيرسون بتطوير نهج بديل. تتطلب هذه الطريقة القيام بمزيد من العمل قبل جمع البيانات، لكنها تتيح للباحثين تصميم دراستهم بطريقة تتحكم في احتمالية الوصول إلى استنتاجات خاطئة.

اختبار الفرضية الصفرية

يُستخدم الدلالة الإحصائية في اختبار الفرضية الصفرية، حيث يحاول الباحثون دعم نظرياتهم من خلال رفض تفسيرات أخرى. على الرغم من أن هذه الطريقة تُفهم أحيانًا بشكل خاطئ، إلا أنها تظل الطريقة الأكثر شيوعًا لاختبار البيانات في الطب وعلم النفس وغيرها من المجالات.

الفرضية الصفرية الأكثر شيوعًا هي أن المعامل المعني يساوي صفرًا (عادةً ما يشير إلى أن المتغير ليس له تأثير على النتيجة محل الاهتمام). إذا رفض الباحثون الفرضية الصفرية بثقة تبلغ 95% أو أكثر، يمكنهم الادعاء بأن العلاقة الملحوظة ذات دلالة إحصائية. يمكن أيضًا اختبار الفرضيات الصفرية لمساواة التأثير بين علاجين بديلين أو أكثر.

على عكس الاعتقاد الشائع، لا يمكن لمستوى عالٍ من الأهمية الإحصائية إثبات أن الفرضية صحيحة أو خاطئة. في الواقع، تقيس الأهمية الإحصائية احتمال حدوث نتيجة ملاحظة، بافتراض أن الفرضية الصفرية صحيحة.

رفض الفرضية الصفرية، حتى لو كان بدرجة عالية جدًا من الأهمية الإحصائية، لا يمكنه أبدًا إثبات شيء ما، بل يمكنه فقط إضافة دعم لفرضية موجودة. من ناحية أخرى، فإن الفشل في رفض الفرضية الصفرية غالبًا ما يكون سببًا لرفض الفرضية.

بالإضافة إلى ذلك، يمكن أن يكون التأثير ذو دلالة إحصائية ولكنه ذو تأثير ضئيل جدًا. على سبيل المثال، قد يكون من الدلالة الإحصائية أن الشركات التي تستخدم ورق التواليت ذو الطبقتين في حماماتها لديها موظفون أكثر إنتاجية، ولكن التحسن في الإنتاجية المطلقة لكل عامل من المحتمل أن يكون ضئيلًا.

كيف تحسب الأهمية الإحصائية؟

يتم حساب الأهمية الإحصائية باستخدام دالة التوزيع التراكمي، والتي يمكن أن تخبرك باحتمالية حدوث نتائج معينة بافتراض أن الفرضية الصفرية صحيحة. إذا قرر الباحثون أن هذه الاحتمالية منخفضة جدًا، يمكنهم استبعاد الفرضية الصفرية.

كيف تُظهر الدلالة الإحصائية في Excel؟

يحتوي Microsoft Excel على وظائف مدمجة لأداء بعض الحسابات اللازمة لاختبارات الدلالة الإحصائية. لإجراء اختبار كاي-تربيع، اكتب =CHISQ.TEST(ActualRange, ExpectedRange)، حيث تكون الوسيطات عبارة عن مصفوفات من الخلايا. لقياس قيمة p، استخدم الوظيفة =T.TEST.

ماذا تقيس الدلالة الإحصائية؟

يُستخدم الدلالة الإحصائية لقياس احتمال وجود علاقة بين متغيرين، بناءً على البيانات الملاحظة. وعلى عكس الاعتقاد الشائع، فإن هذا لا يقيس احتمال أن يكون المتغيران مرتبطين بشكل سببي. بدلاً من ذلك، يقيس احتمال حدوث البيانات الملاحظة بافتراض عدم وجود علاقة بين المتغيرين. وعلى الرغم من أن هذا ليس كافيًا لإثبات السببية، إلا أن الاختبارات المتكررة بدرجة عالية من الدلالة الإحصائية يمكن أن تساعد الباحثين في استبعاد احتمال أن تكون نتائجهم مشوشة بسبب الصدفة العشوائية.

الخلاصة

يُستخدم الدلالة الإحصائية لتقييم إمكانية أن يكون العلاقة الملاحظة نتيجة للصدفة العشوائية. عندما تُظهر الملاحظة علاقة ضعيفة بين متغيرين أو تحتوي على عدد قليل من النقاط البيانية، يُقال إنها غير ذات دلالة إحصائية. ومع ذلك، عندما يكون هناك عدد أكبر من النقاط البيانية التي تُظهر علاقة أكثر اتساقًا، يُقال إن تلك العلاقة ذات دلالة إحصائية.

يستخدم الباحثون الأهمية الإحصائية لتقييم احتمال أن يكون هناك علاقة سببية بين متغيرين.