اختبار T: ما هو مع صيغ متعددة ومتى يتم استخدامه

تعريف

اختبار t هو إحصاء استدلالي يُستخدم في اختبار الفرضيات لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات مجموعتين من العينات.

ما هو اختبار T؟

اختبار t هو إحصاء استدلالي يُستخدم لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات مجموعتين وكيفية ارتباطهما. تُستخدم اختبارات t عندما تتبع مجموعات البيانات توزيعًا طبيعيًا وتكون التباينات غير معروفة، مثل مجموعة البيانات المسجلة من قلب عملة 100 مرة.

اختبار t هو اختبار يُستخدم لاختبار الفرضيات في الإحصاء ويستخدم إحصائية t، وقيم التوزيع t، ودرجات الحرية لتحديد الأهمية الإحصائية.

النقاط الرئيسية

اختبار t هو إحصاء استدلالي يُستخدم لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات متغيرين.
اختبار t هو اختبار يُستخدم لاختبار الفرضيات في الإحصاء.
يتطلب حساب اختبار t الفرق بين القيم المتوسطة لكل مجموعة بيانات، والانحراف المعياري لكل مجموعة، وعدد قيم البيانات.
يمكن أن تكون اختبارات T معتمدة أو مستقلة.

فهم اختبار T

يقارن اختبار t بين القيم المتوسطة لمجموعتي بيانات ويحدد ما إذا كانت قد جاءت من نفس المجتمع الإحصائي. على سبيل المثال، من غير المحتمل أن تكون درجات الطلاب في فصل الفيزياء ودرجات مجموعة مختلفة من الطلاب في فصل الكتابة لها نفس المتوسط والانحراف المعياري. وبالمثل، يجب أن تكون العينات المأخوذة من مجموعة التحكم التي تتغذى على الدواء الوهمي في اختبار دواء وتلك المأخوذة من المجموعة التي وُصف لها الدواء لها متوسط وانحراف معياري مختلف قليلاً.

أربع افتراضات يتم أخذها في الاعتبار عند استخدام اختبار t:

يجب أن تتبع البيانات المجمعة مقياسًا مستمرًا أو ترتيبيًا، مثل الدرجات في اختبار الذكاء (IQ).
يتم جمع البيانات من جزء مختار عشوائيًا من إجمالي السكان.
ستؤدي البيانات إلى توزيع طبيعي على شكل منحنى الجرس.
يوجد تساوي أو تجانس في التباين عندما تكون الانحرافات المعيارية متساوية.

رياضيًا، يأخذ اختبار t عينة من كل من المجموعتين ويضع بيان المشكلة. يفترض فرضية العدم، مما يعني أنه يفترض أن المتوسطين متساويان.

باستخدام صيغ اختبار t، يتم حساب القيم ومقارنتها بالقيم القياسية. هذه المقارنة تساعد في تحديد تأثير الصدفة على الفرق، وما إذا كان الفرق خارج نطاق الصدفة. يطرح اختبار t سؤالًا حول ما إذا كان الفرق بين المجموعات يمثل فرقًا حقيقيًا في الدراسة أو مجرد فرق عشوائي.

بناءً على النتائج، يتم قبول أو رفض الفرضية الصفرية المفترضة. إذا تم رفض الفرضية الصفرية، فهذا يشير إلى أن قراءات البيانات قوية ومن المحتمل أنها ليست بسبب الصدفة.

رفض الفرضية الصفرية: الفروقات ذات دلالة إحصائية
تم قبول الفرضية الصفرية: الفروقات ليست ذات دلالة إحصائية

اختبار t هو واحد فقط من العديد من الاختبارات المستخدمة لهذا الغرض. قد تكون اختبارات أخرى أكثر ملاءمة اعتمادًا على عدد المتغيرات أو حجم العينة. على سبيل المثال، يستخدم الإحصائيون اختبار z لمجموعات البيانات ذات حجم العينة الكبير. تشمل خيارات الاختبار الأخرى اختبار كاي-تربيع واختبار f.

مثال على استخدام اختبار T

تخيل أن شركة تصنيع الأدوية تختبر دواءً جديدًا. وفقًا للإجراءات القياسية، يُعطى الدواء لمجموعة من المرضى، ويُعطى دواء وهمي لمجموعة أخرى تُسمى مجموعة التحكم. الدواء الوهمي هو مادة ليس لها قيمة علاجية ويعمل كمعيار لقياس كيفية استجابة المجموعة الأخرى التي تُعطى الدواء الفعلي.

بعد التجربة الدوائية، أفاد أعضاء المجموعة الضابطة بزيادة في متوسط العمر المتوقع بمقدار ثلاث سنوات. بينما أفاد أعضاء المجموعة التي تم وصف الدواء الجديد لهم بزيادة في متوسط العمر المتوقع بمقدار أربع سنوات.

تشير الملاحظة الأولية إلى أن الدواء يعمل. ومع ذلك، من الممكن أيضًا أن تكون الملاحظة ناتجة عن الصدفة. يمكن استخدام اختبار t لتحديد ما إذا كانت النتائج ذات دلالة إحصائية وقابلة للتطبيق على كامل السكان، أو ما إذا كانت عشوائية وليست نتيجة لتدخل الدواء.

استخدام اختبار T

يتطلب حساب اختبار t ثلاث قيم بيانات أساسية:

الفرق بين القيم المتوسطة لكل مجموعة بيانات، والمعروف أيضًا باسم الفرق المتوسط.
الانحراف المعياري لكل مجموعة standard deviation
عدد القيم البيانية لكل مجموعة

يُنتج اختبار t قيمتين كمخرجات له: قيمة t ودرجات الحرية. قيمة t، أو t-score، هي نسبة الفرق بين متوسط مجموعتي العينات والتباين الموجود داخل مجموعات العينات.

قيمة البسط هي الفرق بين متوسط مجموعتي العينات. أما المقام فهو التباين الموجود داخل مجموعات العينات وهو قياس للتشتت أو التغير.

يتم بعد ذلك مقارنة قيمة t المحسوبة مع قيمة تم الحصول عليها من جدول القيم الحرجة المعروف بجدول توزيع T. تشير القيم الأعلى لنسبة t إلى وجود فرق كبير بين مجموعتي العينات. كلما كانت قيمة t أصغر، زادت التشابهات بين مجموعتي العينات.

تشير قيمة t-score الكبيرة أو قيمة t الكبيرة إلى أن المجموعات مختلفة، بينما تشير قيمة t-score الصغيرة إلى أن المجموعات متشابهة.

تشير درجات الحرية إلى القيم في دراسة التي لديها الحرية في التغيير وهي ضرورية لتقييم أهمية وصحة فرضية العدم. عادةً ما يعتمد حساب هذه القيم على عدد سجلات البيانات المتاحة في مجموعة العينة.

صيغة اختبار T للعينات المزدوجة

اختبار t المرتبط، أو اختبار t المزدوج، هو نوع من الاختبارات المعتمدة ويتم إجراؤه عندما تتكون العينات من أزواج متطابقة من وحدات متشابهة، أو عندما تكون هناك حالات لقياسات متكررة. على سبيل المثال، قد تكون هناك حالات يتم فيها اختبار نفس المرضى بشكل متكرر قبل وبعد تلقي علاج معين. يتم استخدام كل مريض كعينة تحكم ضد نفسه.

تنطبق هذه الطريقة أيضًا على الحالات التي تكون فيها العينات مرتبطة أو لها خصائص متطابقة، مثل التحليل المقارن الذي يشمل الأطفال أو الآباء أو الأشقاء.

الصيغة المستخدمة لحساب قيمة t ودرجات الحرية لاختبار t المزدوج هي:

T = (\frac{\text{mean 1} - \text{mean 2}}{\frac{s(\text{diff})}{\sqrt{n}}})

حيث:

mean 1 و mean 2 = القيم المتوسطة لكل مجموعة من العينات
s(diff) = الانحراف المعياري للفروق بين القيم المزدوجة للبيانات
n = حجم العينة (عدد الفروق المزدوجة)
n - 1 = درجات الحرية

T = (\frac{\text{mean 1} - \text{mean 2}}{\frac{s(\text{diff})}{\sqrt{n}}})

حيث:

mean 1 و mean 2 = القيم المتوسطة لكل مجموعة من العينات
s(diff) = الانحراف المعياري للفروق بين القيم المزدوجة للبيانات
n = حجم العينة (عدد الفروق المزدوجة)
n - 1 = درجات الحرية

اختبار ت (T-Test) للمتغيرات المتساوية أو المجمع:

اختبار t لتساوي التباين هو اختبار t مستقل ويُستخدم عندما يكون عدد العينات في كل مجموعة متساويًا، أو عندما يكون تباين مجموعتي البيانات متشابهًا.

الصيغة المستخدمة لحساب قيمة t ودرجات الحرية لاختبار t لتساوي التباين هي:

قيمة T تساوي الفرق بين المتوسط الأول والمتوسط الثاني مقسومًا على الجذر التربيعي لمجموع (عدد السجلات في العينة الأولى ناقص 1) مضروبًا في مربع التباين الأول و(عدد السجلات في العينة الثانية ناقص 1) مضروبًا في مربع التباين الثاني، مقسومًا على مجموع عدد السجلات في العينة الأولى والعينة الثانية ناقص 2، مضروبًا في مجموع مقلوب عدد السجلات في العينة الأولى ومقلوب عدد السجلات في العينة الثانية.

حيث أن:

المتوسط الأول والمتوسط الثاني هما القيم المتوسطة لكل مجموعة من العينات.
التباين الأول والتباين الثاني هما تباين كل مجموعة من العينات.
عدد السجلات في العينة الأولى وعدد السجلات في العينة الثانية هما عدد السجلات في كل مجموعة من العينات.

و،

درجات الحرية = n1 + n2 - 2 حيث: n1 و n2 = عدد السجلات في كل مجموعة عينة

درجات الحرية تساوي n1 زائد n2 ناقص 2، حيث n1 و n2 هما عدد السجلات في كل مجموعة عينة.

اختبار ت للفرق في التباين غير المتساوي

اختبار t لعدم تساوي التباين هو اختبار t مستقل ويُستخدم عندما يكون عدد العينات في كل مجموعة مختلفًا، ويكون التباين بين مجموعتي البيانات مختلفًا أيضًا. يُعرف هذا الاختبار أيضًا باسم اختبار t لـ Welch.

الصيغة المستخدمة لحساب قيمة t ودرجات الحرية لاختبار t لعدم تساوي التباين هي:

قيمة T تساوي الفرق بين المتوسط الأول والمتوسط الثاني مقسومًا على الجذر التربيعي لمجموع (التباين الأول مقسومًا على عدد السجلات في العينة الأولى زائد التباين الثاني مقسومًا على عدد السجلات في العينة الثانية).

حيث أن:

المتوسط الأول والمتوسط الثاني هما القيم المتوسطة لكل مجموعة من العينات.
التباين الأول والتباين الثاني هما تباين كل مجموعة من العينات.
عدد السجلات في كل مجموعة من العينات هو n1 وn2.

و،

درجات الحرية = (var1^2 / n1 + var2^2 / n2)^2 / ((var1^2 / n1)^2 / (n1 - 1) + (var2^2 / n2)^2 / (n2 - 1))

حيث:
var1 و var2 = التباين لكل مجموعة من العينات
n1 و n2 = عدد السجلات في كل مجموعة من العينات

درجات الحرية تساوي (var1^2 / n1 + var2^2 / n2)^2 مقسومة على ((var1^2 / n1)^2 / (n1 - 1) + (var2^2 / n2)^2 / (n2 - 1))

حيث:
var1 و var2 هما التباين لكل مجموعة من العينات
n1 و n2 هما عدد السجلات في كل مجموعة من العينات

أي اختبار T يجب استخدامه؟

يمكن استخدام مخطط التدفق التالي لتحديد أي اختبار t يجب استخدامه بناءً على خصائص مجموعات العينة. العناصر الرئيسية التي يجب أخذها في الاعتبار تشمل:

تشابه سجلات العينة
عدد سجلات البيانات في كل مجموعة عينة
تباين كل مجموعة عينات

مثال على اختبار T لعدم تساوي التباين

افترض أن القياس القطري للوحات المستلمة في معرض فني قد تم أخذه. تتضمن مجموعة من العينات 10 لوحات، بينما تتضمن المجموعة الأخرى 20 لوحة. مجموعات البيانات، مع القيم المقابلة للـالمتوسط والتباين، هي كما يلي:

مجموعة 1

مجموعة 2

19.7

28.3

20.4

26.7

١٩.٦

20.1

17.8

23.3

١٨.٥

٢٥.٢

١٨.٩

22.1

18.3

17.7

١٨.٩

27.6

19.5

20.6

٢١.٩٥

١٣.٧

23.2

17.5

20.6

٢٣.٩

٢١.٦

24.3

20.4

٢٣.٩

١٣.٣

المتوسط

19.4

٢١.٦

التباين

1.4

17.1

هل الفرق من 19.4 إلى 21.6 ناتج عن الصدفة فقط، أم أن هناك اختلافات في المجموعات السكانية لجميع اللوحات المستلمة في المعرض الفني؟ نقوم بتحديد المشكلة من خلال افتراض الفرضية الصفرية بأن المتوسط هو نفسه بين مجموعتي العينات، ونقوم بإجراء اختبار t للتحقق مما إذا كانت الفرضية معقولة.

نظرًا لأن عدد سجلات البيانات مختلف (n1 = 10 و n2 = 20) والتباين أيضًا مختلف، يتم حساب قيمة t ودرجات الحرية لمجموعة البيانات المذكورة أعلاه باستخدام صيغة اختبار T لعدم تساوي التباين.

قيمة t هي -2.24787. نظرًا لأنه يمكن تجاهل الإشارة السالبة عند مقارنة قيمتي t، فإن القيمة المحسوبة هي 2.24787.

قيمة درجات الحرية هي 24.38 ويتم تقليلها إلى 24 (يتطلب تعريف الصيغة تقريب القيمة إلى أقل عدد صحيح ممكن).

يمكن للمرء تحديد مستوى من الاحتمالية (مستوى ألفا، مستوى الدلالة، p) كمعيار للقبول. في معظم الحالات، يمكن افتراض قيمة 5%.

باستخدام قيمة درجات الحرية 24 ومستوى دلالة 5%، فإن النظر إلى جدول توزيع قيمة t يعطي قيمة 2.064. مقارنة هذه القيمة مع القيمة المحسوبة 2.247 تشير إلى أن قيمة t المحسوبة أكبر من قيمة الجدول عند مستوى دلالة 5%. لذلك، من الآمن رفض الفرضية الصفرية التي تنص على عدم وجود فرق بين المتوسطات.

رفض الفرضية الصفرية يعني أن مجموعة السكان لديها اختلافات جوهرية، وهذه الاختلافات ليست نتيجة للصدفة.

كيف يتم استخدام جدول التوزيع T؟

جدول التوزيع T متاح بصيغتي طرف واحد وطرفين. تُستخدم صيغة الطرف الواحد لتقييم الحالات التي لها قيمة ثابتة أو نطاق مع اتجاه واضح، سواء كان إيجابيًا أو سلبيًا. على سبيل المثال، ما هو احتمال بقاء القيمة الناتجة أقل من -3، أو الحصول على أكثر من سبعة عند رمي زوج من النرد؟ تُستخدم صيغة الطرفين لتحليل النطاق، مثل السؤال عما إذا كانت الإحداثيات تقع بين -2 و +2.

ما هو اختبار T المستقل؟

تُختار عينات اختبارات t المستقلة بشكل مستقل عن بعضها البعض، حيث لا تشير مجموعات البيانات في المجموعتين إلى نفس القيم. قد تتضمن مجموعة من 100 مريض غير مرتبطين عشوائيًا يتم تقسيمهم إلى مجموعتين من 50 مريضًا لكل منهما. تصبح إحدى المجموعات مجموعة التحكم ويتم إعطاؤها دواءً وهميًا، بينما تتلقى المجموعة الأخرى علاجًا موصوفًا. يشكل هذا مجموعتين من العينات المستقلة التي لا ترتبط أو تتزاوج مع بعضها البعض.

ما الذي يوضحه اختبار T وكيف يتم استخدامه؟

اختبار t هو اختبار إحصائي يُستخدم لمقارنة المتوسطات بين مجموعتين. يُستخدم غالبًا في اختبار الفرضيات لتحديد ما إذا كان لعملية أو علاج تأثير على المجتمع المستهدف، أو ما إذا كانت المجموعتان مختلفتين عن بعضهما البعض.

الخلاصة

اختبار t هو إحصاء استدلالي يُستخدم لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات عينتين من السكان. يُستخدم في الإحصاء لاختبار الفرضيات ويمكن أن يشير إلى ما إذا كانت الفروق بين مجموعتين من السكان ذات مغزى أو عشوائية.

يستخدم حساب اختبار t ثلاث بيانات: الفرق بين القيم المتوسطة لكل مجموعة بيانات، والانحراف المعياري لكل مجموعة، وعدد قيم البيانات. هناك تنوعات مختلفة لصيغة اختبار t. يعتمد اختيار الصيغة المناسبة على عوامل مثل تشابه سجلات العينة، حجم كل مجموعة بيانات، وتباين كل مجموعة. ومع ذلك، فإن كل تنوع من اختبار t يُستخدم للتحقيق في نفس السؤال الإحصائي.

#الاستثمار #التحليل الأساسي #أدوات التحليل الأساسي