ما هو النمذجة التنبؤية؟

ما هو النمذجة التنبؤية؟

(النمذجة التنبؤية : predictive modeling)

تعريف

يستخدم النمذجة التنبؤية النتائج المعروفة لإنشاء ومعالجة والتحقق من صحة نموذج للتنبؤات المستقبلية.

ما هو النمذجة التنبؤية؟

يستخدم النمذجة التنبؤية النتائج المعروفة لإنشاء ومعالجة والتحقق من صحة نموذج لتوقع النتائج المستقبلية. إنها أداة تُستخدم في التحليلات التنبؤية، وهي تقنية لاستخراج البيانات. قد تستخدم الشركات النمذجة التنبؤية عند إنشاء حملات تسويقية لقياس استجابات العملاء، وقد يستخدمها المحللون الماليون لتقدير الاتجاهات والأحداث في سوق الأسهم.

النقاط الرئيسية

  • يستخدم النمذجة التنبؤية النتائج المعروفة لإنشاء ومعالجة والتحقق من صحة نموذج يمكن استخدامه لإجراء توقعات مستقبلية.
  • الانحدار والشبكات العصبية هما من أكثر تقنيات النمذجة التنبؤية استخدامًا.
  • تستخدم الشركات النماذج التنبؤية للتنبؤ بالأحداث وسلوك العملاء والمخاطر المالية والاقتصادية والسوقية.

تجميع البيانات

يُشاع أن النمذجة التنبؤية الحديثة بدأت في الأربعينيات، حيث استخدمت الحكومات الحواسيب المبكرة لتحليل بيانات الطقس. ومع زيادة قدرات البرمجيات والأجهزة، أصبحت كميات كبيرة من البيانات قابلة للتخزين والوصول إليها بسهولة أكبر للتحليل.

من خلال تحليل الأحداث التاريخية، يمكن للشركات استخدام النماذج التنبؤية لزيادة احتمالية التنبؤ بالأحداث، وسلوك العملاء، والمخاطر المالية والاقتصادية والسوقية. يمكن للشركات تجميع البيانات في الوقت الفعلي من وسائل التواصل الاجتماعي، وسجل تصفح الإنترنت، وبيانات الهواتف المحمولة، ومنصات الحوسبة السحابية.

نظرًا للكم الهائل من المعلومات، تستخدم الشركات أدوات النمذجة التنبؤية - غالبًا عبر برامج الكمبيوتر. تقوم هذه البرامج بمعالجة كميات كبيرة من البيانات التاريخية لتقييم وتحديد الأنماط. التحليلات التنبؤية هي فرع من التحليلات المتقدمة التي تجمع بين البيانات التاريخية والنمذجة الإحصائية وتقنيات التنقيب عن البيانات والتعلم الآلي.

يمكن للمحللين الماليين استخدام النماذج التنبؤية لتقدير نتائج الاستثمار بناءً على الخصائص الكمية المحيطة بالبيانات التاريخية.

نماذج التصنيف

تستخدم نماذج التصنيف التعلم الآلي لوضع البيانات في فئات أو تصنيفات بناءً على معايير يحددها المستخدم. هناك عدة أنواع من خوارزميات التصنيف، منها:

  • الانحدار اللوجستي: تصنيف ثنائي مثل إجابة نعم أو لا.
  • أشجار القرار: سلسلة من النتائج الثنائية مثل نعم/لا، إذا/إلا، أو غيرها من النتائج الثنائية التي يتم وضعها في تصور يُعرف بشجرة القرار.
  • الغابة العشوائية: خوارزمية تجمع بين أشجار القرار غير المرتبطة باستخدام التصنيف والانحدار.
  • الشبكات العصبية: نماذج تعلم الآلة التي تقوم بمراجعة كميات كبيرة من البيانات للبحث عن الارتباطات التي تظهر فقط بعد النظر في ملايين من نقاط البيانات.

نماذج التجميع

التجميع هو تقنية تقوم بتجميع نقاط البيانات. تفترض أن البيانات في مجموعات متشابهة لها نفس الخصائص، والبيانات في مجموعات مختلفة لها خصائص مختلفة. بعض الخوارزميات الشهيرة للتجميع هي:

  • K-Means: تقنية نمذجة تستخدم المجموعات لتحديد الاتجاهات المركزية لمجموعات مختلفة من البيانات.
  • Mean-Shift: يقوم الخوارزمية بتحويل المتوسط بحيث يتم تحديد "الفقاعات" أو القيم العظمى لدالة الكثافة. عندما يتم رسم النقاط على رسم بياني، يبدو أن البيانات تتجمع حول نقاط مركزية تُسمى المراكز.
  • التجميع المكاني المعتمد على الكثافة مع الضوضاء (DBSCAN): يعد DBSCAN خوارزمية تقوم بتجميع النقاط البيانية معًا بناءً على مسافة محددة بينها. يقوم هذا النموذج بإنشاء علاقات بين المجموعات المختلفة ويحدد النقاط الشاذة.

نماذج القيم الشاذة

دائمًا ما تحتوي مجموعة البيانات على قيم شاذة أو قيم خارج نطاقها الطبيعي. في مجموعة الأرقام المعطاة: 21، 32، 46، 28، 37، و299، تكون الأرقام الخمسة الأولى متشابهة، لكن 299 هو قيمة شاذة. بعض الخوارزميات المستخدمة لتحديد القيم الشاذة هي:

  • غابة العزل (Isolation Forest): خوارزمية تكتشف النقاط البيانية المختلفة في العينة.
  • الحد الأدنى لمحدد التغاير (Minimum Covariance Determinant - MCD): التغاير هو العلاقة بين التغيرات بين متغيرين. يقيس MCD المتوسط والتغاير لمجموعة بيانات بحيث يقلل من تأثير القيم الشاذة على البيانات.
  • العامل المحلي للانحراف (Local Outlier Factor - LOF): هو خوارزمية تحدد نقاط البيانات المجاورة الأقرب وتخصص لها درجات، مما يسمح بتحديد النقاط الأبعد كقيم شاذة.

نماذج السلاسل الزمنية

يستخدم نمذجة السلاسل الزمنية البيانات التاريخية للتنبؤ بالأحداث. بعض النماذج الشائعة للسلاسل الزمنية هي:

  • ARIMA: يستخدم نموذج الانحدار الذاتي المتكامل للمتوسطات المتحركة الانحدار الذاتي، والتكامل (الفروق بين الملاحظات)، والمتوسطات المتحركة للتنبؤ بالاتجاهات أو النتائج.
  • المتوسط المتحرك: يستخدم المتوسط المتحرك متوسط فترة محددة، مثل 50 أو 200 يومًا، مما يساعد في تسوية التقلبات.

كيف تستخدم الشركات النماذج التنبؤية

شركة تعرف ما يمكن توقعه بناءً على البيانات التاريخية يمكنها إدارة المخزون والحملات التسويقية والموارد البشرية بشكل أفضل. الشركات التي تستفيد من البيانات الضخمة من خلال النماذج التنبؤية يمكنها فهم كيفية تفاعل عملائها مع منتجاتها بشكل أفضل وتحديد المخاطر والفرص المحتملة للشركة.

تساعد الأنماط الشركة في التعرف على الاختراقات الأمنية أو السلوك الاحتيالي. يمكن لصناعة التأمين والبنوك استخدام تحليلات البيانات لمراقبة أنماط المخاطر المتعلقة بالتخلف عن سداد القروض أو مبالغ التغطية.

النماذج التنبؤية واضحة في الذكاء الاصطناعي (AI). تقوم الشبكات العصبية بإنشاء شبكة من العقد المترابطة في مستويات هرمية، مما يمثل الأساس للذكاء الاصطناعي، حيث تقوم بإنشاء العلاقات والأنماط بين المتغيرات التي قد تكون مستحيلة أو تستغرق وقتًا طويلاً بالنسبة للمحللين البشريين.

المزايا والعيوب

الإيجابيات

  • من السهل توليد رؤى قابلة للتنفيذ

  • يمكن اختبار سيناريوهات مختلفة

  • يُساهم في اتخاذ القرارات داخل الشركة

سلبيات

  • قد يكون من الصعب فهم النتائج

  • التحيز الناتج عن المدخلات البشرية

  • منحنى تعلم مرتفع عند تحليل البيانات

ما هي خوارزميات النمذجة التنبؤية؟

الخوارزمية هي مجموعة من التعليمات لمعالجة البيانات أو إجراء الحسابات. خوارزميات النمذجة التنبؤية هي مجموعات من التعليمات التي تقوم بمهام النمذجة التنبؤية.

ما هو أكبر افتراض في النمذجة التنبؤية؟

الافتراض الأكثر أهمية في النمذجة التنبؤية هو أن البيانات والاتجاهات المستقبلية ستتبع الأحداث السابقة.

ما هو مثال على النمذجة التنبؤية في الرعاية الصحية؟

يمكن استخدام النمذجة التنبؤية لأغراض عديدة، خاصة في التأمين الصحي. على سبيل المثال، يمكن أن تساعد شركات التأمين في حساب التكاليف للعملاء المحددين بناءً على صحتهم، ونمط حياتهم، وأعمارهم، وظروف أخرى.

الخلاصة

النمذجة التنبؤية هي تحليل إحصائي للبيانات يُستخدم لتوليد سيناريوهات مستقبلية للمنظمات والشركات. يمكن استخدامها في أي صناعة أو مؤسسة أو مسعى يتم فيه جمع البيانات. تعتمد النمذجة التنبؤية على البيانات التاريخية ولا تضمن النتائج المستقبلية.