تعريف
يقيس عامل تضخم التباين (VIF) مقدار التعدد الخطي بين مجموعة من متغيرات الانحدار المتعدد.
ما هو عامل تضخم التباين (VIF)؟
عامل تضخم التباين (VIF) هو مقياس لمقدار التعدد الخطي في تحليل الانحدار. التعدد الخطي يحدث عندما يكون هناك ارتباط بين متغيرات مستقلة متعددة في نموذج الانحدار المتعدد. يمكن أن يؤثر ذلك سلبًا على نتائج الانحدار. وبالتالي، يمكن لعامل تضخم التباين تقدير مدى تضخم تباين معامل الانحدار بسبب التعدد الخطي.
النقاط الرئيسية
- يوفر عامل تضخم التباين (VIF) مقياسًا للتعدد الخطي بين المتغيرات المستقلة في نموذج الانحدار المتعدد.
- يعد اكتشاف التعدد الخطي مهمًا لأنه على الرغم من أن التعدد الخطي لا يقلل من القوة التفسيرية للنموذج، إلا أنه يقلل من الأهمية الإحصائية للمتغيرات المستقلة.
- يشير وجود قيمة كبيرة لمعامل تضخم التباين (VIF) على متغير مستقل إلى وجود علاقة ارتباط عالية مع المتغيرات الأخرى التي يجب أخذها في الاعتبار أو تعديلها في هيكل النموذج واختيار المتغيرات المستقلة.
فهم عامل تضخم التباين (Variance Inflation Factor - VIF)
عامل تضخم التباين هو أداة تساعد في تحديد درجة التعدد الخطي. يتم استخدام الانحدار المتعدد عندما يرغب الشخص في اختبار تأثير متغيرات متعددة على نتيجة معينة. المتغير التابع هو النتيجة التي تتأثر بالمتغيرات المستقلة - المدخلات في النموذج. يوجد التعدد الخطي عندما يكون هناك علاقة خطية، أو ارتباط، بين واحد أو أكثر من المتغيرات المستقلة أو المدخلات.
مشكلة التعدد الخطي (Multicollinearity)
تُشكّل مشكلة التعدد الخطي في نموذج الانحدار المتعدد لأن المدخلات تؤثر على بعضها البعض. وبالتالي، فهي ليست مستقلة فعليًا، ويصبح من الصعب اختبار مدى تأثير مجموعة المتغيرات المستقلة على المتغير التابع، أو النتيجة، داخل نموذج الانحدار.
في حين أن التعدد الخطي لا يقلل من القوة التنبؤية العامة للنموذج، إلا أنه يمكن أن ينتج تقديرات لمعاملات الانحدار التي ليست ذات دلالة إحصائية. يمكن اعتباره نوعًا من العد المزدوج في النموذج.
بالمصطلحات الإحصائية، فإن نموذج الانحدار المتعدد الذي يحتوي على تعدد خطي مرتفع سيجعل من الصعب تقدير العلاقة بين كل من المتغيرات المستقلة والمتغير التابع. بمعنى آخر، عندما تكون متغيرات مستقلة اثنين أو أكثر مرتبطة بشكل وثيق أو تقيس تقريبًا نفس الشيء، فإن التأثير الأساسي الذي تقيسه يتم احتسابه مرتين (أو أكثر) عبر المتغيرات. عندما تكون المتغيرات المستقلة مرتبطة بشكل وثيق، يصبح من الصعب تحديد أي متغير يؤثر على المتغيرات التابعة.
يمكن أن تؤدي التغييرات الصغيرة في البيانات المستخدمة أو في هيكل معادلة النموذج إلى تغييرات كبيرة وغير منتظمة في المعاملات المقدرة على المتغيرات المستقلة. هذه مشكلة لأن الهدف من العديد من النماذج الاقتصادية القياسية هو اختبار هذا النوع من العلاقة الإحصائية بين المتغيرات المستقلة والمتغير التابع.
اختبارات لحل مشكلة التعدد الخطي المتعدد
لضمان تحديد النموذج بشكل صحيح وعمله بشكل سليم، هناك اختبارات يمكن إجراؤها للكشف عن التعدد الخطي (multicollinearity). يُعتبر عامل تضخم التباين (Variance Inflation Factor) أحد أدوات القياس المستخدمة لهذا الغرض. يساعد استخدام عوامل تضخم التباين في تحديد مدى خطورة أي مشاكل تتعلق بالتعدد الخطي بحيث يمكن تعديل النموذج وفقًا لذلك. يقيس عامل تضخم التباين مدى تأثر أو تضخم سلوك (تباين) المتغير المستقل نتيجة تفاعله أو ارتباطه مع المتغيرات المستقلة الأخرى.
تسمح عوامل تضخم التباين بقياس سريع لمقدار مساهمة متغير ما في الخطأ المعياري في الانحدار. عندما توجد مشكلات كبيرة في التعدد الخطي، سيكون عامل تضخم التباين كبيرًا جدًا للمتغيرات المعنية. بعد تحديد هذه المتغيرات، يمكن استخدام عدة طرق لإزالة أو دمج المتغيرات المتعددة الخطية، مما يحل مشكلة التعدد الخطي.
صيغة وحساب عامل تضخم التباين (VIF)
الصيغة المستخدمة لحساب معامل تضخم التباين (VIF) هي:
معامل تضخم التباين (VIF) للمتغير i يُحسب باستخدام المعادلة التالية:
VIF_i = 1 / (1 - R_i^2)
حيث:
R_i^2 هو معامل التحديد غير المعدل عند إجراء الانحدار للمتغير المستقل i على المتغيرات الأخرى المتبقية.
ماذا يمكن أن يخبرك VIF؟
عندما يكون Ri2 مساويًا لـ 0، وبالتالي عندما يكون VIF أو التحمّل مساويًا لـ 1، فإن المتغير المستقل i لا يكون مرتبطًا بالمتغيرات الأخرى، مما يعني أن تعدد التداخلات الخطية (multicollinearity) غير موجود.
بشكل عام،
- معامل التضخم التبايني (VIF) يساوي 1 = المتغيرات غير مترابطة.
- معامل التضخم التبايني (VIF) بين 1 و5 = المتغيرات مترابطة بشكل معتدل.
- إذا كان معامل تضخم التباين (VIF) أكبر من 5 = فإن المتغيرات مترابطة بشكل كبير.
كلما ارتفع معامل التضخم التبايني (VIF)، زادت احتمالية وجود التعدد الخطي، ويجب إجراء المزيد من البحث. عندما يكون معامل التضخم التبايني (VIF) أعلى من 10، يكون هناك تعدد خطي كبير يحتاج إلى تصحيح.
مثال على استخدام VIF
على سبيل المثال، افترض أن اقتصاديًا يريد اختبار ما إذا كان هناك علاقة ذات دلالة إحصائية بين معدل البطالة (المتغير المستقل) ومعدل التضخم (المتغير التابع). إن تضمين متغيرات مستقلة إضافية ذات صلة بـمعدل البطالة، مثل المطالبات الجديدة للعاطلين عن العمل jobless claims، من المحتمل أن يؤدي إلى إدخال التعدد الخطي في النموذج.
قد يُظهر النموذج العام قوة تفسيرية قوية وكافية إحصائيًا، ولكنه قد يكون غير قادر على تحديد ما إذا كان التأثير يرجع في الغالب إلى معدل البطالة أو إلى المطالبات الجديدة للعاطلين عن العمل. هذا ما يمكن أن يكتشفه معامل تضخم التباين (VIF)، وقد يقترح إمكانية حذف أحد المتغيرات من النموذج أو إيجاد طريقة لدمجها لالتقاط تأثيرها المشترك، وذلك بناءً على الفرضية المحددة التي يهتم الباحث باختبارها.
ما هو قيمة VIF الجيدة؟
كقاعدة عامة، فإن قيمة VIF (مؤشر تضخم التباين) التي تبلغ ثلاثة أو أقل لا تعتبر مصدر قلق. كلما زادت قيمة VIF، كلما أصبحت نتائج الانحدار الخاصة بك أقل موثوقية.
ماذا يعني معامل تضخم التباين (VIF) بقيمة 1؟
قيمة VIF تساوي واحد تعني أن المتغيرات غير مترابطة وأن تعدد التداخلات الخطية لا يوجد في نموذج الانحدار.
ما هو استخدام VIF؟
يقيس VIF قوة الارتباط بين المتغيرات المستقلة في تحليل الانحدار. يُعرف هذا الارتباط بالتعدد الخطي، والذي يمكن أن يسبب مشاكل لنماذج الانحدار.
الخلاصة
في حين أن وجود قدر معتدل من التعدد الخطي المتعدد مقبول في نموذج الانحدار، فإن ارتفاع التعدد الخطي المتعدد يمكن أن يكون سببًا للقلق.
يمكن اتخاذ إجراءين لتصحيح مشكلة التعدد الخطي العالي. أولاً، يمكن إزالة واحد أو أكثر من المتغيرات التي تتمتع بارتباط عالٍ، حيث إن المعلومات التي تقدمها هذه المتغيرات زائدة عن الحاجة. الطريقة الثانية هي استخدام تحليل المكونات الرئيسية أو الانحدار الجزئي الأقل تربيعاً بدلاً من الانحدار الخطي العادي (OLS)، حيث يمكن لهذه الطرق تقليل عدد المتغيرات إلى مجموعة أصغر بدون ارتباط، أو إنشاء متغيرات جديدة غير مرتبطة. هذا سيحسن من قدرة النموذج على التنبؤ.