درجات الحرية في الإحصاء: الشرح والصيغة مع المثال

درجات الحرية في الإحصاء: الشرح والصيغة مع المثال

(درجات الحرية : degrees of freedom)

ما هي درجات الحرية؟

درجات الحرية هي الحد الأقصى لعدد القيم المستقلة منطقيًا، والتي يمكن أن تتغير في عينة البيانات. يتم حساب درجات الحرية عن طريق طرح واحد من عدد العناصر داخل عينة البيانات.

النقاط الرئيسية

  • تشير درجات الحرية إلى الحد الأقصى لعدد القيم المستقلة منطقيًا، والتي قد تتغير في عينة البيانات.
  • يتم حساب درجات الحرية عن طريق طرح واحد من عدد العناصر داخل عينة البيانات.
  • تم ملاحظة المفهوم الأولي لدرجات الحرية في أوائل القرن التاسع عشر من خلال أعمال عالم الرياضيات والفلك كارل فريدريش جاوس.
  • تُناقش درجات الحرية بشكل شائع في أشكال مختلفة من اختبار الفرضيات في الإحصاء، مثل اختبار كاي تربيع.
  • يمكن أن تصف درجات الحرية في الأعمال التجارية الحالات التي يجب فيها على الإدارة اتخاذ قرار يحدد نتيجة متغير آخر.

فهم درجات الحرية

درجات الحرية هي عدد المتغيرات المستقلة التي يمكن تقديرها في التحليل الإحصائي، وتخبرك بعدد العناصر التي يمكن اختيارها عشوائيًا قبل أن يتعين وضع قيود.

داخل مجموعة بيانات، يمكن اختيار بعض الأرقام الأولية بشكل عشوائي. ومع ذلك، إذا كان يجب أن تضيف مجموعة البيانات إلى مجموع محدد أو المتوسط، على سبيل المثال، فإن الرقم في مجموعة البيانات يكون مقيدًا لتقييم قيم جميع القيم الأخرى في مجموعة البيانات، ثم تلبية المتطلبات المحددة.

أمثلة على درجات الحرية

مثال 1: لنفترض أن لدينا عينة بيانات تتكون من خمسة أعداد صحيحة موجبة. يجب أن يكون متوسط قيم الأعداد الخمسة هو ستة. إذا كانت أربعة عناصر ضمن مجموعة البيانات هي {3، 8، 5، و4}، فيجب أن يكون الرقم الخامس هو 10. نظرًا لأنه يمكن اختيار الأرقام الأربعة الأولى بشكل عشوائي، فإن درجة الحرية هي أربعة.

مثال 2: لنفترض أن لدينا عينة بيانات تتكون من خمسة أعداد صحيحة موجبة. يمكن أن تكون القيم أي أرقام دون وجود علاقة معروفة بينها. نظرًا لأنه يمكن اختيار جميع الأعداد الخمسة بشكل عشوائي دون قيود، فإن درجة الحرية هي أربعة.

مثال 3: لنفكر في عينة بيانات تتكون من عدد صحيح واحد. يجب أن يكون هذا العدد فرديًا. نظرًا لوجود قيود على العنصر الوحيد داخل مجموعة البيانات، فإن درجة الحرية تساوي صفرًا.

درجات الحرية (Degrees of Freedom) صيغة

الصيغة لتحديد درجات الحرية هي:

درجات الحرية تساوي حجم العينة ناقص واحد حيث: درجات الحرية تساوي عدد درجات الحرية، و N تساوي حجم العينة.

على سبيل المثال، تخيل مهمة اختيار عشرة لاعبي بيسبول يجب أن يكون متوسط ضرباتهم .250. العدد الإجمالي للاعبين الذين سيشكلون مجموعة بياناتنا هو حجم العينة، لذا N = 10. في هذا المثال، يمكن اختيار 9 (10 - 1) لاعبي بيسبول بشكل عشوائي، مع وجود اللاعب العاشر بمتوسط ضربات محدد للالتزام بشرط متوسط الضربات .250.

بعض الحسابات لدرجات الحرية مع وجود معلمات أو علاقات متعددة تستخدم الصيغة درجات الحرية = N - P، حيث P هو عدد المعلمات أو العلاقات المختلفة. على سبيل المثال، في اختبار t لعينة مزدوجة، يتم استخدام N - 2 لأنه يوجد معلمتان للتقدير.

تطبيق درجات الحرية

في الإحصاء، تحدد درجات الحرية شكل توزيع t المستخدم في اختبارات t عند حساب قيمة p. اعتمادًا على حجم العينة، ستظهر درجات الحرية المختلفة توزيعات t مختلفة. حساب درجات الحرية أمر حاسم عند فهم أهمية إحصائية كاي-تربيع وصحة الفرضية الصفرية.

درجات الحرية لها تطبيقات مفاهيمية أيضًا خارج نطاق الإحصاءات. فكر في شركة تقرر شراء المواد الخام لعملية التصنيع الخاصة بها. تحتوي مجموعة البيانات هذه على عنصرين للشركة: كمية المواد الخام التي يجب الحصول عليها والتكلفة الإجمالية للمواد الخام.

تختار الشركة بحرية أحد الخيارين، ولكن اختيارها سيحدد نتيجة الخيار الآخر. لأنها تستطيع اختيار أحد الخيارين بحرية فقط، فإن لديها درجة حرية واحدة في هذا الموقف. إذا قررت الشركة كمية المواد الخام، فلن تتمكن من تحديد المبلغ الإجمالي الذي سيتم إنفاقه. من خلال تحديد المبلغ الإجمالي للإنفاق، قد تكون الشركة محدودة في كمية المواد الخام التي يمكنها الحصول عليها.

اختبارات كاي تربيع

هناك نوعان مختلفان من اختبارات كاي تربيع: اختبار الاستقلالية، الذي يطرح سؤالًا حول العلاقة، مثل "هل هناك علاقة بين الجنس ودرجات اختبار SAT؟"؛ واختبار جودة المطابقة، الذي يطرح سؤالًا مثل "إذا تم رمي عملة 100 مرة، هل ستظهر وجه العملة 50 مرة وظهرها 50 مرة؟"

بالنسبة لهذه الاختبارات، يتم استخدام درجات الحرية لتحديد ما إذا كان يمكن رفض الفرضية الصفرية بناءً على العدد الإجمالي للمتغيرات والعينات داخل التجربة. على سبيل المثال، عند النظر في الطلاب واختيار الدورات، فإن حجم عينة من 30 أو 40 طالبًا قد لا يكون كبيرًا بما يكفي لتوليد بيانات ذات دلالة. الحصول على نفس النتائج أو نتائج مشابهة من دراسة باستخدام حجم عينة من 400 أو 500 طالب يكون أكثر صحة.

اختبار T

لإجراء اختبار t، يجب حساب قيمة t للعينة ومقارنتها بقيمة حرجة. ستختلف القيمة الحرجة، ويمكنك تحديد القيمة الحرجة الصحيحة باستخدام توزيع t لمجموعة البيانات مع درجات الحرية.

المجموعات ذات درجات الحرية الأقل لديها احتمال أعلى للقيم المتطرفة، بينما درجات الحرية الأعلى، مثل حجم العينة الذي لا يقل عن 30، ستكون أقرب بكثير إلى منحنى التوزيع الطبيعي. الأحجام الأصغر للعينة ستتوافق مع درجات حرية أصغر وستؤدي إلى ذيول توزيع t أكثر سمكًا.

في الأمثلة أعلاه، يمكن استخدام العديد من الحالات كاختبار t لعينة واحدة. على سبيل المثال، "المثال 1"، حيث يتم اختيار خمسة قيم ولكن يجب أن تضيف إلى متوسط محدد، يمكن تعريفه كاختبار t لعينة واحدة. وذلك لأن هناك قيد واحد فقط يتم وضعه على المتغير.

تاريخ درجات الحرية

تمت ملاحظة أقدم وأبسط مفهوم لدرجات الحرية في أوائل القرن التاسع عشر، وكان ذلك متداخلاً في أعمال عالم الرياضيات والفلك كارل فريدريش جاوس. وقد تم توضيح الاستخدام والفهم الحديث للمصطلح لأول مرة من قبل ويليام سيلي جوسيت، وهو إحصائي إنجليزي، في مقاله "الخطأ المحتمل للمتوسط"، الذي نُشر في مجلة Biometrika عام 1908 تحت اسم مستعار للحفاظ على هويته مجهولة.

في كتاباته، لم يستخدم جوسيت مصطلح "درجات الحرية" بشكل محدد. لكنه شرح المفهوم أثناء تطوير ما سيعرف في النهاية باسم "توزيع تي (T-distribution) لطالب". لم يصبح المصطلح شائعًا حتى عام 1922. حيث بدأ عالم الأحياء والإحصاء الإنجليزي رونالد فيشر باستخدام مصطلح "درجات الحرية" عندما نشر تقارير وبيانات عن عمله في تطوير مربع كاي.

كيف تحدد درجات الحرية؟

عند تحديد المتوسط لمجموعة من البيانات، يتم حساب درجات الحرية على أنها عدد العناصر داخل المجموعة ناقص واحد. وذلك لأن جميع العناصر داخل تلك المجموعة يمكن اختيارها بشكل عشوائي حتى يتبقى عنصر واحد؛ ويجب أن يتوافق هذا العنصر مع المتوسط المعطى.

ماذا تخبرك درجات الحرية؟

تخبرك درجات الحرية بعدد الوحدات داخل مجموعة يمكن اختيارها دون قيود مع الالتزام بقانون معين يشرف على المجموعة. على سبيل المثال، فكر في مجموعة مكونة من خمسة عناصر تضيف إلى قيمة متوسطة تبلغ 20. تخبرك درجات الحرية بعدد العناصر (4) التي يمكن اختيارها عشوائيًا قبل أن يتعين وضع قيود. في هذا المثال، بمجرد اختيار العناصر الأربعة الأولى، لم يعد لديك الحرية لاختيار نقطة بيانات عشوائيًا لأنك يجب أن "تفرض التوازن" للوصول إلى المتوسط المعطى.

هل درجة الحرية دائمًا 1؟

درجات الحرية هي دائمًا عدد الوحدات داخل مجموعة معينة ناقص 1. يكون الطرح دائمًا بمقدار واحد لأنه إذا تم وضع معايير على مجموعة البيانات، يجب أن يكون العنصر الأخير في البيانات محددًا بحيث تتوافق جميع النقاط الأخرى مع تلك النتيجة.

الخلاصة

قد تتطلب بعض عمليات التحليل الإحصائي إشارة إلى عدد القيم المستقلة التي يمكن أن تتغير ضمن التحليل لتلبية متطلبات القيود. هذه الإشارة هي درجات الحرية، وهي عدد الوحدات في حجم العينة التي يمكن اختيارها عشوائيًا قبل أن يتم اختيار قيمة محددة.