مجموع المربعات المتبقية (Residual Sum of Squares - RSS): ما هو وكيفية حسابه

مجموع المربعات المتبقية (Residual Sum of Squares - RSS): ما هو وكيفية حسابه

(مجموع المربعات المتبقية : Residual Sum of Squares)

ما هو مجموع المربعات المتبقية (Residual Sum of Squares - RSS)؟

مجموع المربعات المتبقية (RSS) هو تقنية إحصائية تُستخدم لقياس مقدار التباين في مجموعة بيانات لا يفسرها نموذج الانحدار نفسه. بدلاً من ذلك، يقوم بتقدير التباين في المتبقيات، أو مصطلح الخطأ.

الانحدار الخطي هو قياس يساعد في تحديد قوة العلاقة بين المتغير التابع وواحد أو أكثر من العوامل الأخرى، المعروفة بالمتغيرات المستقلة أو التفسيرية.

النقاط الرئيسية

  • يقيس مجموع المربعات المتبقية (RSS) مستوى التباين في مصطلح الخطأ، أو المتبقيات، في نموذج الانحدار.
  • كلما كان مجموع المربعات المتبقية أصغر، كان نموذجك أفضل في ملاءمة البيانات؛ وكلما كان مجموع المربعات المتبقية أكبر، كان نموذجك أقل ملاءمة للبيانات.
  • قيمة الصفر تعني أن النموذج الخاص بك مناسب تمامًا.
  • يستخدم المستثمرون ومديرو المحافظ النماذج الإحصائية لتتبع سعر الاستثمار واستخدام تلك البيانات للتنبؤ بالحركات المستقبلية.
  • يستخدم المحللون الماليون مجموع المربعات المتبقية (RSS) لتقدير صحة نماذجهم الاقتصادية.

فهم مجموع المربعات المتبقية (Residual Sum of Squares - RSS)

بشكل عام، تُعتبر مجموع المربعات تقنية إحصائية تُستخدم في تحليل الانحدار لتحديد تشتت نقاط البيانات. في تحليل الانحدار، الهدف هو تحديد مدى ملاءمة سلسلة البيانات لوظيفة قد تساعد في تفسير كيفية توليد سلسلة البيانات. تُستخدم مجموع المربعات كطريقة رياضية لإيجاد الوظيفة التي تناسب بشكل أفضل (تتغير بأقل قدر) من البيانات.

يقيس مجموع المربعات المتبقية (RSS) مقدار الخطأ المتبقي بين دالة الانحدار ومجموعة البيانات بعد تشغيل النموذج. يشير رقم أصغر لمجموع المربعات المتبقية إلى أن دالة الانحدار ملائمة بشكل جيد للبيانات.

يُعرف RSS أيضًا بمجموع المربعات المتبقية، وهو يحدد بشكل أساسي مدى جودة تفسير أو تمثيل نموذج الانحدار للبيانات في النموذج.

كيفية حساب مجموع المربعات المتبقية

RSS = مجموع (yi - f(xi)) تربيع من i=1 إلى n

حيث:

yi = القيمة i من المتغير الذي سيتم التنبؤ به

f(xi) = القيمة المتوقعة لـ yi

( n ) هو الحد الأعلى لعملية الجمع

مجموع المربعات المتبقية (Residual Sum of Squares - RSS) مقابل الخطأ المعياري المتبقي (Residual Standard Error - RSE)

الخطأ المعياري المتبقي (RSE) هو مصطلح إحصائي آخر يُستخدم لوصف الفرق في الانحرافات المعيارية للقيم الملاحظة مقابل القيم المتوقعة كما يظهر من خلال النقاط في تحليل الانحدار. إنه مقياس لجودة الملاءمة goodness-of-fit يمكن استخدامه لتحليل مدى توافق مجموعة من النقاط البيانية مع النموذج الفعلي.

يتم حساب الخطأ المعياري المتبقي (RSE) عن طريق قسمة مجموع المربعات المتبقية (RSS) على عدد الملاحظات في العينة ناقص 2، ثم أخذ الجذر التربيعي: الخطأ المعياري المتبقي = الجذر التربيعي لـ (مجموع المربعات المتبقية مقسومًا على (عدد الملاحظات ناقص 2)).

تقليل مجموع المربعات المتبقية (RSS) لتحقيق الملاءمة المثلى

في مجال تحليل الانحدار، يُعتبر تقليل مجموع المربعات المتبقية أمرًا حيويًا لتحقيق أفضل ملاءمة ممكنة للنموذج مع البيانات. من بين التقنيات المختلفة لتحقيق ذلك، تُعد طريقة المربعات الصغرى واحدة من الأساليب الأساسية والأكثر استخدامًا.

الانحدار بطريقة المربعات الصغرى هو أسلوب يهدف إلى إيجاد الخط أو المنحنى الذي يقلل من مجموع الفروق المربعة. هذه الفروق تكون بين القيم الملاحظة والقيم التي يتنبأ بها النموذج. في جوهره، يسعى الانحدار بطريقة المربعات الصغرى إلى تحقيق توازن حيث يلتقط النموذج الاتجاه الأساسي للبيانات مع تقليل الفروق بين ما تم ملاحظته وما تم التنبؤ به.

تتضمن عملية تقليل مجموع المربعات المتبقية (RSS) من خلال الانحدار بطريقة المربعات الصغرى تعديل معلمات النموذج بشكل تكراري. يتم ذلك عادةً حتى يتم تحقيق الملاءمة المثلى. بالنسبة لنموذج الانحدار الخطي البسيط، يتضمن ذلك عادةً إيجاد الميل والجزء المقطوع من الخط الذي يناسب البيانات بشكل أفضل. في السيناريوهات الأكثر تعقيدًا، تصبح العملية أكثر تعقيدًا ولكنها تحتفظ بالعديد من المبادئ نفسها.

قيود خدمة RSS

يحتوي مجموع مربعات البواقي (RSS) على بعض القيود. أولاً، يعطي مجموع مربعات البواقي وزنًا متساويًا لجميع البواقي. وهذا يعني أن القيم الشاذة يمكن أن تؤثر بشكل غير متناسب على مجموع مربعات البواقي، مما يعني أن المعاملات المقدرة قد تكون منحرفة بشكل سلبي. جانب سلبي آخر هو أن مجموع مربعات البواقي يعتمد على عدة افتراضات. إذا تم انتهاك أي افتراض مثل الخطية، أو استقلالية الأخطاء، أو تجانس التباين، فقد يؤدي مجموع مربعات البواقي إلى تقديرات متحيزة واستنتاجات غير صحيحة.

في حين أن مجموع المربعات المتبقية (RSS) مفيد لتقييم ملاءمة نموذج واحد، إلا أن مقارنة الملاءمة عبر نماذج متعددة باستخدام مجموع المربعات المتبقية وحده يمكن أن تكون صعبة. وذلك لأن مجموع المربعات المتبقية يعتمد على عدد المعلمات في النموذج. فهو ليس مصممًا حقًا لمقارنة النماذج التي تحتوي على عدد مختلف من المعلمات.

أخيرًا، على الرغم من أن مجموع المربعات المتبقية (RSS) سهل الحساب والتفسير، إلا أنه يوفر فهمًا محدودًا للبنية الأساسية للبيانات. في الحالات التي يكون فيها فهم العلاقة بين المتغيرات المستقلة والمتغير التابع مهمًا، قد تكون هناك مقاييس أفضل للاستخدام. في بعض النواحي، يمكن أن يعمل مجموع المربعات المتبقية (RSS) بشكل يشبه الصندوق الأسود حيث لا تكون العلاقات معروفة تمامًا؛ فقط القيمة النهائية هي الأكثر أهمية.

اعتبارات خاصة

الأسواق المالية أصبحت بشكل متزايد مدفوعة بالتحليل الكمي؛ ولذلك، في البحث عن ميزة، يستخدم العديد من المستثمرين تقنيات إحصائية متقدمة للمساعدة في قراراتهم. البيانات الضخمة، وتطبيقات التعلم الآلي، والذكاء الاصطناعي تزيد من الحاجة لاستخدام الخصائص الإحصائية لتوجيه استراتيجيات الاستثمار المعاصرة. مجموع المربعات المتبقية—أو إحصائيات RSS—هو واحد من العديد من الخصائص الإحصائية التي تشهد نهضة.

يستخدم المستثمرون ومديرو المحافظ النماذج الإحصائية لتتبع سعر الاستثمار واستخدام تلك البيانات للتنبؤ بالحركات المستقبلية. قد تتضمن الدراسة، التي تُعرف بتحليل الانحدار، تحليل العلاقة في تحركات الأسعار بين سلعة معينة وأسهم الشركات المشاركة في إنتاج تلك السلعة.

قد يكون لأي نموذج تباينات بين القيم المتوقعة والنتائج الفعلية. وعلى الرغم من أن التباينات قد يتم تفسيرها بواسطة تحليل الانحدار، إلا أن مجموع مربعات البواقي (RSS) يمثل التباينات أو الأخطاء التي لم يتم تفسيرها.

نظرًا لأنه يمكن إنشاء دالة انحدار معقدة بما يكفي لتناسب تقريبًا أي مجموعة بيانات بشكل وثيق، فإن هناك حاجة إلى دراسة إضافية لتحديد ما إذا كانت دالة الانحدار مفيدة بالفعل في تفسير تباين مجموعة البيانات.

عادةً، يكون من المثالي أن يكون هناك قيمة أصغر أو أقل لـ RSS في أي نموذج، حيث يعني ذلك أن هناك تباينًا أقل في مجموعة البيانات. بعبارة أخرى، كلما كان مجموع المربعات المتبقية أقل، كان نموذج الانحدار أفضل في تفسير البيانات.

مثال على خدمة RSS

للحصول على توضيح بسيط (ولكن مطول) لحساب مجموع المربعات المتبقية (RSS)، فكر في العلاقة المعروفة بين إنفاق المستهلك في بلد ما والناتج المحلي الإجمالي الخاص به. يعكس المخطط التالي القيم المنشورة لـإنفاق المستهلك والناتج المحلي الإجمالي للدول الـ27 في الاتحاد الأوروبي. لاحظ أن هذه المعلومات قد تكون تغيرت قليلاً منذ نشرها، لكن مثال مجموع المربعات المتبقية يبقى صالحًا.

الإنفاق الاستهلاكي مقابل الناتج المحلي الإجمالي لدول الاتحاد الأوروبي

الدولة

الإنفاق الاستهلاكي (ملايين)

الناتج المحلي الإجمالي (GDP) (ملايين)

309,018.88

٤٣٣٬٢٥٨٫٤٧

388,436.00

521,861.29

54,647.31

69,889.35

٤٧٬٣٩٢٫٨٦

57,203.78

٢٠,٥٩٢.٧٤

٢٤٬٦١٢٫٦٥

164,933.47

245,349.49

251,478.47

356,084.87

٢١٬٧٧٦٫٠٠

٣٠٬٦٥٠٫٢٩

٢٠٣,٧٣١.٢٤

٢٦٩,٧٥١.٣١

٢٬٠٥٧٬١٢٦٫٠٣

٢٬٦٣٠٬٣١٧٫٧٣

٢٬٨١٢٬٧١٨٫٤٥

٣,٨٤٦,٤١٣.٩٣

174,893.21

١٨٨٬٨٣٥٫٢٠

110,323.35

١٥٥٬٨٠٨٫٤٤

١٦٠٬٥٦١٫٠٧

425,888.95

١,٤٨٦,٩١٠.٤٤

١,٨٨٨,٧٠٩.٤٤

٢٥٬٧٧٦٫٧٤

٣٣,٧٠٧.٣٢

43,679.20

56,546.96

٣٥,٩٥٣.٢٩

٧٣,٣٥٣.١٣

٩,٨٠٨.٧٦

14,647.38

٦٢٠٬٠٥٠٫٣٠

٩١٣,٨٦٥.٤٠

453,186.14

596,624.36

١٩٠,٥٠٩.٩٨

٢٢٨,٥٣٩.٢٥

198,867.77

٢٤٨,٧١٥.٥٥

٨٣,٨٤٥.٢٧

١٠٥٬١٧٢٫٥٦

٣٧٬٩٢٩٫٢٤

53,589.61

997,452.45

١,٢٨١،٤٨٤.٦٤

٣٨٢٬٢٤٠٫٩٢

541,220.06

البنك الدولي

الإنفاق الاستهلاكي والناتج المحلي الإجمالي (GDP) لهما علاقة إيجابية قوية، ومن الممكن التنبؤ بالناتج المحلي الإجمالي لدولة ما بناءً على الإنفاق الاستهلاكي (CS). باستخدام صيغة خط الانحدار الأفضل، يمكن تقريب هذه العلاقة كما يلي:

الناتج المحلي الإجمالي (GDP) = 1.3232 × الإنفاق الاستهلاكي (CS) + 10447

الوحدات لكل من الناتج المحلي الإجمالي والإنفاق الاستهلاكي هي بملايين الدولارات الأمريكية.

هذه الصيغة دقيقة للغاية لمعظم الأغراض، لكنها ليست مثالية بسبب التفاوتات الفردية في اقتصاد كل بلد. يوضح الرسم البياني التالي مقارنة بين الناتج المحلي الإجمالي المتوقع لكل بلد، بناءً على الصيغة المذكورة أعلاه، والناتج المحلي الإجمالي الفعلي كما سجلته البنك الدولي.

الأرقام المتوقعة والفعلية للناتج المحلي الإجمالي لدول الاتحاد الأوروبي، والمربعات المتبقية

الدولة

الإنفاق الاستهلاكي القيمة الأحدث (بالملايين)

القيمة الأحدث للناتج المحلي الإجمالي (بالملايين)

الناتج المحلي الإجمالي المتوقع (استنادًا إلى خط الاتجاه)

مربع الباقي (المتوقع - الحقيقي)^2

309,018.88

٤٣٣٬٢٥٨٫٤٧

419,340.782016

193,702,038.819978

388,436.00

521,861.29

524,425.52

٦,٥٧٥,٢٥٠.٨٧٦٣١٥٠٤

54,647.31

69,889.35

82,756.320592

165,558,932.215393

٤٧٬٣٩٢٫٨٦

57,203.78

73,157.232352

254,512,641.947534

٢٠,٥٩٢.٧٤

٢٤٬٦١٢٫٦٥

37,695.313568

171,156,086.033474

164,933.47

245,349.49

228,686.967504

277,639,655.929706

251,478.47

356,084.87

343,203.311504

165,934,549.28587

٢١٬٧٧٦٫٠٠

٣٠٬٦٥٠٫٢٩

٣٩٬٢٦١٫٠٠

74,144,381.8126542

٢٠٣,٧٣١.٢٤

٢٦٩,٧٥١.٣١

280,024.176768

105,531,791.633079

٢٬٠٥٧٬١٢٦٫٠٣

٢٬٦٣٠٬٣١٧٫٧٣

٢٬٧٣٢٬٤٣٦٫١٦٢٨٩٦

10,428,174,337.1349

٢٬٨١٢٬٧١٨٫٤٥

٣,٨٤٦,٤١٣.٩٣

٣,٧٣٢,٢٣٦.٠٥٣٠٤

١٣,٠٣٦,٥٨٧,٥٨٧.٠٩٢٩

174,893.21

١٨٨٬٨٣٥٫٢٠

241,865.695472

٢,٨١٢,٢٣٣,٤٥٠.٠٠٥٨١

110,323.35

١٥٥٬٨٠٨٫٤٤

156,426.85672

382,439.239575558

١٦٠٬٥٦١٫٠٧

425,888.95

222,901.407824

41,203,942,278.6534

١,٤٨٦,٩١٠.٤٤

١,٨٨٨,٧٠٩.٤٤

1,977,926.894208

٧,٩٥٩,٧٥٤,١٣٥.٣٥٦٥٨

٢٥٬٧٧٦٫٧٤

٣٣,٧٠٧.٣٢

44,554.782368

117,667,439.825176

43,679.20

56,546.96

68,243.32

136,804,777.364243

٣٥,٩٥٣.٢٩

٧٣,٣٥٣.١٣

58,020.393328

235,092,813.852894

٩,٨٠٨.٧٦

14,647.38

23,425.951232

77,063,312.875298

٦٢٠٬٠٥٠٫٣٠

٩١٣,٨٦٥.٤٠

٨٣٠٬٨٩٧٫٥٦

٦,٨٨٣,٦٦٢,٩٧٨.٧١

453,186.14

596,624.36

610,102.900448

181,671,052.608372

١٩٠,٥٠٩.٩٨

٢٢٨,٥٣٩.٢٥

262,529.805536

١,١٥٥,٣٥٧,٨٦٥.٦٤٥٩

198,867.77

٢٤٨,٧١٥.٥٥

273,588.833264

618,680,220.331183

٨٣,٨٤٥.٢٧

١٠٥٬١٧٢٫٥٦

121,391.061264

263,039,783.25037

٣٧٬٩٢٩٫٢٤

53,589.61

60,634.970368

49,637,102.7149851

997,452.45

١,٢٨١،٤٨٤.٦٤

١٬٣٣٠٬٢٧٦٫٠٨١٨٤

٢٬٣٨٠٬٦٠٤٬٧٩٦٫٨٢٦١

٣٨٢٬٢٤٠٫٩٢

541,220.06

516,228.185344

624,593,798.821215

البنك الدولي

يشير العمود الموجود على اليمين إلى المربعات المتبقية - الفرق المربع بين كل قيمة متوقعة وقيمتها الفعلية. تبدو الأرقام كبيرة، لكن مجموعها في الواقع أقل من مجموع مربعات البواقي (RSS) لأي خط اتجاه آخر ممكن. إذا كان هناك خط آخر لديه مجموع مربعات بواقي أقل لهذه النقاط البيانية، فسيكون ذلك الخط هو خط الانحدار الأفضل.

هل مجموع المربعات المتبقية هو نفسه معامل التحديد (R-Squared)؟

مجموع المربعات المتبقية (RSS) هو الكمية المطلقة للتغير المفسر، بينما R-squared هو الكمية المطلقة للتغير كنسبة من التغير الكلي.

هل مجموع المربعات المتبقية (RSS) هو نفسه مجموع مربعات تقدير الأخطاء (SSE)؟

مجموع المربعات المتبقية (RSS) يُعرف أيضًا بمجموع مربعات تقدير الأخطاء (SSE).

ما الفرق بين مجموع المربعات المتبقي ومجموع المربعات الكلي؟

يقيس مجموع المربعات الكلي (TSS) مقدار التباين الموجود في البيانات الملاحظة، بينما يقيس مجموع المربعات المتبقية التباين في الخطأ بين البيانات الملاحظة والقيم النموذجية. في الإحصاء، غالبًا ما تتم مقارنة القيم لمجموع المربعات المتبقية ومجموع المربعات الكلي (TSS) مع بعضها البعض.

هل يمكن أن يكون مجموع المربعات المتبقي صفرًا؟

يمكن أن يكون مجموع المربعات المتبقي صفرًا. كلما كان مجموع المربعات المتبقي أصغر، كان نموذجك أفضل في ملاءمة البيانات؛ وكلما كان مجموع المربعات المتبقي أكبر، كان نموذجك أقل ملاءمة للبيانات. قيمة الصفر تعني أن نموذجك يتناسب بشكل مثالي.

الخلاصة

ي quantifies مجموع مربعات البواقي الفارق بين النقاط البيانية الملاحظة والتنبؤات التي يقدمها نموذج الانحدار، ويتم حسابه كمجموع مربعات البواقي. يُعتبر تقليل مجموع مربعات البواقي هدفًا أساسيًا في تحليل الانحدار، حيث يمثل مدى دقة النموذج في تمثيل التغيرات في البيانات.