تعريف الخطأ المعياري (SE): شرح الانحراف المعياري في الإحصاء

تعريف الخطأ المعياري (SE): شرح الانحراف المعياري في الإحصاء

(الخطأ المعياري : standard error الانحراف المعياري : standard deviation)

ما هو الخطأ المعياري (SE)؟

الخطأ المعياري (SE) هو إحصائية تكشف مدى دقة تمثيل بيانات العينة للمجتمع ككل. يقيس مدى دقة تمثيل توزيع العينة للمجتمع. في الإحصائيات، ينحرف متوسط العينة عن المتوسط الفعلي للمجتمع؛ هذا الانحراف هو الخطأ المعياري للمتوسط.

يُعتبر الخطأ المعياري جزءًا من الإحصاء الاستدلالي، أو الاستنتاجات المستخلصة من الدراسة. وهو يتناسب عكسيًا مع حجم العينة؛ فكلما زاد حجم العينة، قل الخطأ المعياري لأن الإحصائية ستقترب من القيمة الفعلية.

النقاط الرئيسية

  • الخطأ المعياري هو الانحراف المعياري التقريبي لعينة إحصائية من السكان.
  • يصف الخطأ المعياري التباين بين المتوسط المحسوب للسكان والمتوسط الذي يُعتبر معروفًا أو مقبولًا كدقيق.
  • كلما زاد عدد نقاط البيانات المستخدمة في حساب المتوسط، كلما كان الخطأ المعياري أصغر عادةً.

فهم الخطأ المعياري

يُستخدم المصطلح "الخطأ المعياري"، أو SE اختصارًا، للإشارة إلى الانحراف المعياري لمختلف إحصائيات العينة، مثل المتوسط أو الوسيط.

عند أخذ عينة من السكان، يتم عادةً حساب المتوسط أو المعدل. يصف الخطأ المعياري التباين بين المتوسط المحسوب للسكان والمتوسط الذي يُعتبر معروفًا أو مقبولًا كدقيق. يساعد هذا في التعويض عن أي أخطاء عرضية تتعلق بجمع العينة.

يشير "الخطأ المعياري للمتوسط" إلى الانحراف المعياري لتوزيع متوسطات العينات المأخوذة من مجتمع. العلاقة بين الخطأ المعياري والانحراف المعياري هي أنه، بالنسبة لحجم عينة معين، يساوي الخطأ المعياري الانحراف المعياري مقسومًا على الجذر التربيعي لحجم العينة.

يتم التعبير عن انحراف الخطأ المعياري كرقم. في بعض الأحيان، يكون من الضروري أو المرغوب فيه عرض الانحراف كنسبة مئوية. عندما يتم عرضه كنسبة مئوية، يُعرف باسم الخطأ المعياري النسبي.

الخطأ المعياري والانحراف المعياري هما مقاييس للتغير، بينما تشمل مقاييس النزعة المركزية المتوسط الحسابي والوسيط، وغيرها.

كلما كان الخطأ المعياري أصغر، كانت العينة أكثر تمثيلاً للمجتمع الكلي. وكلما زاد عدد النقاط البيانية المستخدمة في حساب المتوسط، يميل الخطأ المعياري إلى أن يكون أصغر. في الحالات التي يكون فيها الخطأ المعياري كبيرًا، قد تحتوي البيانات على بعض الشذوذات الملحوظة.

في الحالات التي يتم فيها جمع عينات متعددة، قد يختلف متوسط كل عينة قليلاً عن الأخرى، مما يخلق تباينًا بين المتغيرات. يتم قياس هذا التباين غالبًا باستخدام الخطأ المعياري، الذي يأخذ في الاعتبار الفروق بين المتوسطات عبر مجموعات البيانات.

صيغة وحساب الخطأ المعياري

يُستخدم في التداول الخوارزمي، يمكن حساب الخطأ المعياري للتقدير عن طريق قسمة الانحراف المعياري على الجذر التربيعي لحجم العينة:

SE = σ ÷ √n حيث:
σ = الانحراف المعياري للسكان
√n = الجذر التربيعي لحجم العينة

حيث:
SE = σ ÷ √n
σ = الانحراف المعياري للسكان
√n = الجذر التربيعي لحجم العينة

إذا لم تكن الانحراف المعياري للسكان معروفة، يمكنك استبدالها بالانحراف المعياري للعينة، s، في البسط لتقريب الخطأ المعياري.

الخطأ المعياري مقابل الانحراف المعياري

الانحراف المعياري هو تمثيل لتوزيع كل نقطة من نقاط البيانات. يُستخدم للمساعدة في تحديد صحة البيانات بناءً على عدد نقاط البيانات المعروضة عند كل مستوى من مستويات الانحراف المعياري.

تعمل الأخطاء المعيارية بشكل أكبر كوسيلة لتحديد دقة العينة أو دقة عينات متعددة من خلال تحليل الانحراف داخل المتوسطات.

يعمل الخطأ المعياري على تطبيع الانحراف المعياري بالنسبة لحجم العينة المستخدمة في التحليل. يقيس الانحراف المعياري مقدار التباين أو التشتت للبيانات حول المتوسط. يمكن اعتبار الخطأ المعياري كتشتت تقديرات متوسط العينة حول متوسط المجتمع الحقيقي.

مثال على الخطأ المعياري

لنقل إن محللًا قد قام بدراسة عينة عشوائية من 50 شركة في مؤشر S&P 500 لفهم العلاقة بين نسبة السعر إلى الأرباح (P/E) للسهم وأداءه في السوق خلال الـ 12 شهرًا التالية.

افترض أن التقدير الناتج هو -0.20، مما يشير إلى أنه لكل 1.0 نقطة في نسبة السعر إلى الأرباح (P/E ratio)، تحقق الأسهم أداءً أقل بنسبة 0.2%. في العينة المكونة من 50، تم العثور على الانحراف المعياري ليكون 1.0.

الخطأ المعياري هو بالتالي:

SE = 1.0 مقسومة على الجذر التربيعي لـ 50 = 1 مقسومة على 7.07 = 0.141

مما يعني أن SE تساوي 1.0 مقسومة على الجذر التربيعي لـ 50، وهو ما يعادل 1 مقسومة على 7.07، والنتيجة هي 0.141.

لذلك، سنقوم بالإبلاغ عن التقدير كـ -0.20% ± 0.14، مما يعطينا فترة ثقة تتراوح بين (-0.34 و -0.06). وبالتالي، فإن القيمة المتوسطة الحقيقية للعلاقة بين نسبة السعر إلى الأرباح (P/E) والعوائد لمؤشر S&P 500 ستقع ضمن هذا النطاق بدرجة عالية من الاحتمال.

لنفترض الآن أننا نزيد عينة الأسهم إلى 100 ونجد أن التقدير يتغير قليلاً من -0.20 إلى -0.25، وأن الانحراف المعياري ينخفض إلى 0.90. وبالتالي، سيكون الخطأ المعياري الجديد:

SE = 0.90 مضروبة في الجذر التربيعي لـ 100 تساوي 0.90 مضروبة في 10 تساوي 0.09.

SE = 0.90 مقسومة على الجذر التربيعي لـ 100 تساوي 0.90 مقسومة على 10 تساوي 0.09.

SE = 0.90 مقسومة على الجذر التربيعي لـ 100 تساوي 0.90 مقسومة على 10 تساوي 0.09.

تصبح فترة الثقة الناتجة -0.25 ± 0.09 = (-0.34 - -0.16)، وهي نطاق أضيق من القيم.

ما المقصود بالخطأ المعياري؟

الخطأ المعياري هو بشكل بديهي الانحراف المعياري لتوزيع العينة. بمعنى آخر، يوضح مدى التباين المحتمل في تقدير نقطة تم الحصول عليها من عينة مقارنة بمتوسط المجتمع الحقيقي.

ما هو الخطأ المعياري الجيد؟

يقيس الخطأ المعياري مقدار التباين الذي يمكن توقعه في تقدير العينة مقارنة بالقيمة الحقيقية في المجتمع. لذلك، كلما كان الخطأ المعياري أصغر، كان ذلك أفضل. في الواقع، يشير الخطأ المعياري الذي يساوي صفر (أو قريب منه) إلى أن القيمة المقدرة هي بالضبط القيمة الحقيقية.

كيف تجد الخطأ المعياري؟

يأخذ الخطأ المعياري الانحراف المعياري ويقسمه على الجذر التربيعي لحجم العينة. تقوم العديد من حزم البرمجيات الإحصائية بحساب الأخطاء المعيارية تلقائيًا.

الخلاصة

يقيس الخطأ المعياري (SE) تشتت القيم المقدرة التي تم الحصول عليها من عينة حول القيمة الحقيقية الموجودة في المجتمع.

التحليل الإحصائي والاستدلال غالبًا ما يتضمن أخذ عينات وإجراء اختبارات إحصائية لتحديد الارتباطات والعلاقات بين المتغيرات. وبالتالي، يخبرنا الخطأ المعياري بدرجة الثقة التي يمكننا بها توقع أن القيمة المقدرة تقارب قيمة المجتمع.