التعدد الخطي: المعنى، الأمثلة، والأسئلة الشائعة

التعدد الخطي: المعنى، الأمثلة، والأسئلة الشائعة

(التعدد الخطي: multicollinearity)

ما هو التعدد الخطي؟

تعدد التداخل هو حدوث ترابطات عالية بين متغيرين مستقلين أو أكثر في نموذج الانحدار المتعدد. يمكن أن يؤدي تعدد التداخل إلى نتائج منحرفة أو مضللة عندما يحاول الباحث أو المحلل تحديد مدى فعالية استخدام كل متغير مستقل للتنبؤ أو فهم المتغير التابع في النموذج الإحصائي.

بشكل عام، يمكن أن يؤدي التعدد الخطي المتعدد إلى فترات ثقة أوسع، مما ينتج عنه احتمالات أقل موثوقية فيما يتعلق بتأثير المتغيرات المستقلة في النموذج.

في التحليل الفني، يمكن أن يؤدي تعدد التداخلات إلى افتراضات غير صحيحة حول الاستثمار. يحدث ذلك عادةً لأن العديد من المؤشرات من نفس النوع قد تم استخدامها لتحليل سهم معين.

النقاط الرئيسية

  • التعدد الخطي هو مفهوم إحصائي حيث تكون عدة متغيرات مستقلة في النموذج مترابطة.
  • يُعتبر متغيران متلازمان تمامًا إذا كان معامل الارتباط بينهما هو +/- 1.0.
  • سيؤدي التعدد الخطي بين المتغيرات المستقلة إلى استنتاجات إحصائية أقل موثوقية.
  • عند تحليل استثمار، من الأفضل استخدام أنواع مختلفة من المؤشرات بدلاً من استخدام مؤشرات متعددة من نفس النوع لتجنب التعددية الخطية.
  • يمكن أن يؤدي التعدد الخطي (Multicollinearity) إلى نتائج أقل موثوقية لأن النتائج التي تقارنها تكون عادةً متشابهة.

فهم التعدد الخطي المتعدد

يستخدم المحللون الإحصائيون نماذج الانحدار المتعدد للتنبؤ بقيمة متغير تابع محدد بناءً على قيم متغيرين مستقلين أو أكثر. يُطلق أحيانًا على المتغير التابع اسم المتغير الناتج أو الهدف أو المعيار.

مثال على ذلك هو نموذج الانحدار متعدد المتغيرات الذي يحاول التنبؤ بعوائد الأسهم بناءً على مقاييس مثل نسبة السعر إلى الأرباح (نسب P/E)، أو القيمة السوقية، أو بيانات أخرى. عائد السهم هو المتغير التابع (النتيجة)، بينما تعتبر البيانات المالية المختلفة هي المتغيرات المستقلة.

يشير التعدد الخطي في نموذج الانحدار المتعدد إلى أن المتغيرات المستقلة المتداخلة ليست مستقلة حقًا. على سبيل المثال، قد يكون الأداء السابق مرتبطًا بـ القيمة السوقية. تشهد أسهم الشركات التي أدت أداءً جيدًا ثقة المستثمرين، مما يزيد من الطلب على أسهم تلك الشركة، وبالتالي يزيد من قيمتها السوقية.

آثار التعدد الخطي

على الرغم من أن التعدد الخطي لا يؤثر على تقديرات الانحدار، إلا أنه يجعلها غامضة وغير دقيقة وغير موثوقة. وبالتالي، قد يكون من الصعب تحديد كيفية تأثير المتغيرات المستقلة على المتغير التابع بشكل فردي. هذا يؤدي إلى تضخيم الأخطاء المعيارية لبعض أو جميع معاملات الانحدار.

اكتشاف التعدد الخطي المتعدد

تقنية إحصائية تُسمى عامل تضخم التباين (VIF) يمكنها اكتشاف وقياس مقدار التعدد الخطي في نموذج الانحدار المتعدد. يقيس VIF مدى تضخم تباين معاملات الانحدار المقدرة مقارنةً بحالة عدم ارتباط المتغيرات التنبؤية بشكل خطي. إذا كان VIF يساوي 1، فهذا يعني أن المتغيرات غير مترابطة؛ وإذا كان VIF بين 1 و5، فهذا يدل على أن المتغيرات مترابطة بشكل معتدل، أما إذا كان VIF بين 5 و10، فهذا يعني أن المتغيرات مترابطة بشكل كبير.

عند تحليل الأسهم، يمكنك اكتشاف التعدد الخطي من خلال ملاحظة ما إذا كانت المؤشرات ترسم نفس الرسوم البيانية. على سبيل المثال، اختيار مؤشرين للزخم على مخطط التداول سيؤدي عادةً إلى إنشاء خطوط اتجاه تشير إلى نفس الزخم.

أسباب التعدد الخطي المتعدد

يمكن أن توجد مشكلة التعدد الخطي عندما يكون هناك ارتباط عالي بين متغيرين مستقلين. يمكن أن تحدث أيضًا إذا تم حساب متغير مستقل من متغيرات أخرى في مجموعة البيانات أو إذا قدم متغيران مستقلان نتائج متشابهة ومتكررة.

مرة أخرى، إذا كنت تستخدم نفس البيانات لإنشاء نوعين أو ثلاثة من نفس نوع مؤشرات التداول، فإن النتائج ستكون متعددة التداخل (multicollinear) لأن البيانات وطريقة معالجتها لإنشاء المؤشرات متشابهة جدًا.

الاستنتاجات الإحصائية من نموذج يحتوي على تعدد خطي قد لا تكون موثوقة.

أنواع التعدد الخطي المتعدد

التعدد الخطي المثالي

يُظهر التعدد الخطي المثالي وجود علاقة خطية دقيقة بين متغيرات مستقلة متعددة. يُلاحظ هذا عادةً في الرسم البياني حيث تقع نقاط البيانات على طول خط الانحدار. في التحليل الفني، يمكن رؤيته عند استخدام مؤشرين يقيسان نفس الشيء، مثل الحجم. إذا وضعت أحدهما فوق الآخر، فلن يكون هناك فرق بينهما.

الارتباط المتعدد العالي

يشير الارتباط المتعدد العالي إلى وجود ارتباط بين متغيرات مستقلة متعددة، ولكنه ليس محكمًا كما هو الحال في الارتباط المتعدد المثالي. لا تقع جميع نقاط البيانات على خط الانحدار، ولكنه لا يزال يشير إلى أن البيانات مترابطة بشكل كبير بحيث لا يمكن استخدامها.

في التحليل الفني، المؤشرات التي تتمتع بدرجة عالية من التعدد الخطي (multicollinearity) تقدم نتائج متشابهة جدًا.

التعدد الخطي الهيكلي

يحدث التعدد الخطي الهيكلي عندما تستخدم البيانات لإنشاء ميزات جديدة. على سبيل المثال، إذا قمت بجمع البيانات ثم استخدمتها لإجراء حسابات أخرى وأجريت تحليل الانحدار على النتائج، فإن النتائج ستكون مترابطة لأنها مشتقة من بعضها البعض.

هذا هو النوع من التعدد الخطي الذي يُرى في تحليل الاستثمار لأن نفس البيانات تُستخدم لإنشاء مؤشرات مختلفة.

التعدد الخطي القائم على البيانات

تؤدي تجربة أو عملية جمع بيانات سيئة التصميم، مثل استخدام البيانات الرصدية، عادةً إلى التعدد الخطي القائم على البيانات، حيث تكون البيانات مترابطة بسبب طبيعة الطريقة التي تم جمعها بها. تكون بعض أو جميع المتغيرات مترابطة.

يتم جمع بيانات الأسهم المستخدمة لإنشاء المؤشرات عادةً من الأسعار التاريخية وحجم التداول، لذا فإن احتمالية أن تكون متعددة التداخل بسبب طريقة جمع سيئة هي احتمالية صغيرة.

التعدد الخطي في الاستثمار

في مجال الاستثمار، يُعتبر التعدد الخطي (multicollinearity) اعتبارًا شائعًا عند إجراء التحليل الفني للتنبؤ بالحركات السعرية المستقبلية المحتملة لأداة مالية، مثل الأسهم أو عقود السلع المستقبلية.

يرغب المحللون في تجنب استخدام المؤشرات الفنية التي تكون متداخلة في كونها تعتمد على مدخلات متشابهة أو مرتبطة بشكل كبير؛ والمقصود بالمدخلات هنا ليس البيانات نفسها، بل كيفية معالجتها لتحقيق النتيجة المطلوبة.

بدلاً من ذلك، يجب أن يستند التحليل إلى مؤشرات مختلفة بشكل واضح لضمان تحليل السوق من وجهات نظر تحليلية مستقلة. على سبيل المثال، تشترك مؤشرات الزخم والاتجاه في نفس البيانات، لكنها لن تكون متعددة التداخل بشكل مثالي أو حتى تظهر تداخلًا عاليًا. هذه المؤشرات لها نتائج مختلفة بناءً على كيفية معالجة البيانات.

كيفية معالجة التعدد الخطي المتعدد

إحدى الطرق الأكثر شيوعًا للتخلص من مشكلة التعدد الخطي هي أولاً تحديد المتنبئين المستقلين المتعددين ثم إزالة واحد أو أكثر منهم. بشكل عام، في الإحصائيات، يتم إجراء حساب عامل تضخم التباين لتحديد درجة التعدد الخطي. طريقة بديلة لحل مشكلة التعدد الخطي هي جمع المزيد من البيانات تحت ظروف مختلفة.

في تحليل الاستثمار

المحلل الفني المعروف جون بولينجر، مبتكر مؤشر Bollinger Bands، كتب أن "قاعدة أساسية لاستخدام التحليل الفني بنجاح تتطلب تجنب التعددية الخطية بين المؤشرات." لحل هذه المشكلة، يتجنب المحللون استخدام مؤشرين فنيين أو أكثر من نفس النوع. بدلاً من ذلك، يقومون بتحليل الورقة المالية باستخدام نوع واحد من المؤشرات، مثل مؤشر الزخم، ثم يقومون بتحليل منفصل باستخدام نوع مختلف من المؤشرات، مثل مؤشر الاتجاه.

على سبيل المثال، فإن المؤشرات العشوائية، ومؤشر القوة النسبية (RSI)، وWilliams %R (Wm%R) جميعها مؤشرات زخم تعتمد على مدخلات مشابهة ومن المحتمل أن تنتج نتائج متشابهة. في الصورة أعلاه، المؤشرات العشوائية وWm%R متطابقة، لذا فإن استخدامها معًا لا يكشف الكثير. في هذه الحالة، من الأفضل إزالة أحد المؤشرات واستخدام مؤشر لا يتتبع الزخم. في الصورة أدناه، تظهر المؤشرات العشوائية زخم السعر، بينما يظهر عرض نطاق بولينجر (Bollinger Band Width) تماسك السعر قبل حركة السعر.

كيف يمكن التعامل مع التعدد الخطي المتعدد؟

لتقليل كمية التعدد الخطي الموجودة في نموذج إحصائي، يمكن إزالة المتغيرات المحددة التي تم التعرف عليها على أنها الأكثر ارتباطًا. يمكنك أيضًا محاولة دمج أو تحويل المتغيرات المسببة لخفض ارتباطها. إذا لم ينجح ذلك أو كان غير ممكن، هناك نماذج انحدار معدلة تتعامل بشكل أفضل مع التعدد الخطي، مثل انحدار الحافة (ridge regression)، أو انحدار المكونات الرئيسية (principal component regression)، أو انحدار المربعات الصغرى الجزئية (partial least squares regression). في تحليل الأسهم، فإن أفضل طريقة هي اختيار أنواع مختلفة من المؤشرات.

ما هو التعدد الخطي في الانحدار؟

تصف التعددية الخطية المتعددة العلاقة بين المتغيرات التي تجعلها مترابطة. البيانات التي تحتوي على تعددية خطية متعددة تطرح مشاكل للتحليل لأنها ليست مستقلة.

كيف تفسر نتائج التعدد الخطي؟

ستكون البيانات ذات تعددية خطية عالية عندما يكون عامل تضخم المتغير أكثر من خمسة. إذا كان عامل تضخم المتغير بين واحد وخمسة، فإن المتغيرات تكون مرتبطة بشكل معتدل، وإذا كانت تساوي واحدًا، فإنها غير مرتبطة. في التحليل الفني، ستكون المؤشرات عمومًا متطابقة.

ما هي التعددية الخطية المثالية؟

توجد مشكلة التعدد الخطي المثالي عندما يكون هناك تطابق دقيق بنسبة 1:1 بين متغيرين مستقلين في نموذج. يمكن أن يكون هذا إما ارتباطًا بقيمة +1.0 أو -1.0.

لماذا يُعتبر التعدد الخطي مشكلة؟

تُعتبر مشكلة تعدد التداخلات الخطية مشكلة لأنها تؤدي إلى نتائج أقل موثوقية في نماذج الانحدار. يعود ذلك إلى اتساع فترات الثقة (زيادة الأخطاء المعيارية) التي يمكن أن تقلل من الأهمية الإحصائية لمعاملات الانحدار. في تحليل الأسهم، يمكن أن يؤدي ذلك إلى انطباعات أو افتراضات خاطئة حول الاستثمار.

الخلاصة

توجد مشكلة التعدد الخطي عندما يكون هناك ارتباط عالي بين متغير مستقل واحد أو أكثر من المتغيرات المستقلة الأخرى في معادلة الانحدار المتعدد. التعدد الخطي يمثل مشكلة لأنه يجعل الاستدلالات الإحصائية أقل موثوقية. ومع ذلك، يمكن لعامل تضخم التباين (VIF) أن يوفر معلومات حول أي من المتغيرات زائدة عن الحاجة، وبالتالي يمكن إزالة المتغيرات التي لديها VIF مرتفع.

عند استخدام التحليل الفني، تصبح مشكلة التعدد الخطي (multicollinearity) واضحة لأن هناك العديد من المؤشرات التي تعرض البيانات بنفس الطريقة. لمنع ذلك، من الأفضل استخدام مؤشرات لا تقيس نفس الاتجاه.