كيف يعمل الاستنتاج العكسي؟

في الاستقراء العكسي، تبدأ بأخر إجراء لأخر لاعب في اللعبة، وتستنتج بشكل عكسي من تلك النقطة. إذا كنت تستطيع تخيل الإجراء الأمثل لأخر لاعب، يمكنك عندها استنتاج الإجراء الأمثل للاعب الذي يسبقه، وهكذا صعودًا في شجرة القرارات حتى تصل إلى الإجراء الأول لأول لاعب. يفترض الاستقراء العكسي عقلانية اللاعبين والمعلومات الكاملة، ويعمل بشكل أفضل في الألعاب المتتابعة.

ما هو الاستقراء العكسي؟ التعريف، كيفية عمله، ومثال

ما هو الاستقراء العكسي؟

الاستقراء العكسي هو عملية تكرارية للتفكير بشكل عكسي من نهاية مشكلة أو موقف لحل الألعاب ذات الشكل الواسع والمتسلسل المحدود واستنتاج سلسلة من الإجراءات المثلى. يُستخدم في نظرية الألعاب لتحديد أكثر سلسلة مثلى من الإجراءات بناءً على السلوك العقلاني.

النقاط الرئيسية

الاستقراء العكسي هو طريقة لتحليل أفضل استراتيجية للعبة، بدءًا من إجراء اللاعب الأخير والتحرك إلى الوراء.
يحدد بشكل فعال توازن ناش لكل لعبة فرعية من اللعبة.
تفترض هذه العملية سلوكًا عقلانيًا من جميع اللاعبين، ولكن في الحياة الواقعية، قد يتخذ اللاعبون "غير العقلانيين" خيارات مختلفة عن تلك المتوقعة باستخدام الاستنتاج العكسي—وينتهي بهم الأمر بالحصول على عوائد أكبر.

فهم الاستقراء العكسي

تم استخدام الاستقراء العكسي لحل الألعاب منذ أن قام جون فون نيومان وأوسكار مورجنسترن بتأسيس نظرية الألعاب كموضوع أكاديمي عندما نشرا كتابهما، نظرية الألعاب والسلوك الاقتصادي في عام 1944.

في كل مرحلة من مراحل اللعبة، يحدد الاستنتاج العكسي الاستراتيجية المثلى للاعب الذي يقوم بالخطوة الأخيرة في اللعبة. ثم يتم تحديد الإجراء الأمثل للاعب الذي يقوم بالخطوة قبل الأخيرة، مع اعتبار إجراء اللاعب الأخير كما هو معطى. يستمر هذا العملية بشكل عكسي حتى يتم تحديد أفضل إجراء لكل نقطة زمنية.

ومع ذلك، غالبًا ما تفشل النتائج المستنتجة من الاستقراء العكسي في التنبؤ باللعب الفعلي للبشر. حاولت الدراسات تفسير سبب ندرة ظهور السلوك "العقلاني" (كما تتنبأ به نظرية الألعاب) في الحياة الواقعية؛ فقد أظهر علماء النفس دانيال كانيمان وأموس تفيرسكي، على سبيل المثال، أن تحيزات الناس، والتفكير الخاطئ، والنفور من الخسارة تؤثر على سلوكهم، مما يؤدي إلى اتخاذ قرارات غير عقلانية.

مثال على الاستقراء العكسي

من المثير للاهتمام أن اللاعبين غير العقلانيين قد ينتهي بهم الأمر بالحصول على عوائد أعلى مما تنبأت به الاستنتاجات العكسية، كما هو موضح في لعبة المئة قدم. في هذه اللعبة، يحصل لاعبان بالتناوب على فرصة لأخذ حصة أكبر من وعاء متزايد من المال، أو تمرير الوعاء إلى اللاعب الآخر. يتم ترتيب العوائد بحيث إذا تم تمرير الوعاء إلى الخصم وأخذ الخصم الوعاء في الجولة التالية، يحصل اللاعب على أقل قليلاً مما كان سيحصل عليه إذا أخذ الوعاء في هذه الجولة. تنتهي اللعبة بمجرد أن يأخذ أحد اللاعبين الحصة، حيث يحصل هذا اللاعب على الجزء الأكبر واللاعب الآخر على الجزء الأصغر.

كمثال على الاستقراء العكسي والعائد الأعلى لاتخاذ القرارات غير العقلانية، افترض أن عزاز وجيان يلعبان لعبة المئوية. يبدأ عزاز وعليه أن يقرر ما إذا كان يجب عليه "أخذ" أو "تمرير" الكنز، الذي يبلغ حاليًا 2 دولار. إذا أخذ، يحصل عزاز وجيان على دولار واحد لكل منهما، ولكن إذا مرر عزاز، يجب على جيان الآن اتخاذ القرار بشأن الأخذ أو التمرير. إذا أخذ جيان، يحصل على 3 دولارات (أي الكنز السابق البالغ 2 دولار + 1 دولار) ويحصل عزاز على 0 دولار. ولكن إذا مرر جيان، يحصل عزاز الآن على فرصة لاتخاذ قرار الأخذ أو التمرير، وهكذا. إذا اختار كلا اللاعبين دائمًا التمرير، يحصل كل منهما على عائد قدره 100 دولار في نهاية اللعبة.

النقطة الأساسية في اللعبة هي أنه إذا تعاون كل من إيزاز وجيان واستمروا في التمرير حتى نهاية اللعبة، فإنهم يحصلون على أعلى عائد ممكن وهو 100 دولار لكل منهما. ولكن إذا لم يثقوا في اللاعب الآخر وتوقعوا أن يقوم الآخر "بالأخذ" عند أول فرصة، فإن توازن ناش يتنبأ بأن اللاعبين سيأخذون أقل مطالبة ممكنة (1 دولار في هذه الحالة).

التوازن الناش (Nash equilibrium) في هذه اللعبة، حيث لا يوجد لدى أي لاعب حافز للانحراف عن استراتيجيته المختارة بعد النظر في اختيار الخصم، يشير إلى أن اللاعب الأول سيأخذ الجائزة في الجولة الأولى من اللعبة. ومع ذلك، في الواقع، عدد قليل نسبيًا من اللاعبين يفعلون ذلك. ونتيجة لذلك، يحصلون على عائد أعلى من العائد المتوقع من خلال تحليل التوازنات.

حل الألعاب المتسلسلة باستخدام الاستقراء العكسي

فيما يلي لعبة بسيطة متتابعة بين لاعبين. تُظهر التسميات الخاصة باللاعب 1 واللاعب 2 مجموعات المعلومات لكل منهما. الأرقام الموجودة بين القوسين في أسفل الشجرة تمثل العوائد في كل نقطة على التوالي. اللعبة أيضًا متتابعة، لذا يتخذ اللاعب 1 القرار الأول (يسار أو يمين) ويتخذ اللاعب 2 قراره بعد اللاعب 1 (أعلى أو أسفل).

الاستقراء العكسي، مثل كل نظرية الألعاب، يستخدم افتراضات العقلانية والتعظيم، مما يعني أن اللاعب 2 سيعظم مكافأته في أي موقف معين. في أي مجموعة معلومات لدينا خياران، أي أربعة خيارات في المجموع. من خلال استبعاد الخيارات التي لن يختارها اللاعب 2، يمكننا تضييق شجرتنا. بهذه الطريقة، سنحدد الخطوط باللون الأزرق التي تعظم مكافأة اللاعب في مجموعة المعلومات المعطاة.

بعد هذا التخفيض، يمكن للاعب 1 تعظيم عوائده الآن بعد أن أصبحت خيارات اللاعب 2 معروفة. النتيجة هي توازن تم العثور عليه من خلال الاستقراء العكسي حيث يختار اللاعب 1 "اليمين" واللاعب 2 يختار "الأعلى". أدناه هو الحل للعبة مع مسار التوازن مميزًا بالخط العريض.

على سبيل المثال، يمكن بسهولة إعداد لعبة مشابهة لتلك المذكورة أعلاه باستخدام الشركات كلاعبين. يمكن أن تتضمن هذه اللعبة سيناريوهات إطلاق المنتجات. إذا أرادت الشركة 1 إطلاق منتج، ماذا قد تفعل الشركة 2 كرد فعل؟ هل ستقوم الشركة 2 بإطلاق منتج منافس مشابه؟ من خلال التنبؤ بمبيعات هذا المنتج الجديد في سيناريوهات مختلفة، يمكننا إعداد لعبة للتنبؤ بكيفية تطور الأحداث. أدناه مثال على كيفية نمذجة مثل هذه اللعبة.

كيف تعمل عملية الاستقراء العكسي؟

في الاستقراء العكسي، تبدأ بأخر إجراء لأخر لاعب في اللعبة، وتستنتج بشكل عكسي من تلك النقطة. إذا كان بإمكانك تخيل الإجراء الأمثل لأخر لاعب، فيمكنك استنتاج الإجراء الأمثل للاعب الذي يسبقه، وهكذا حتى تصل إلى أول إجراء لأول لاعب. يفترض الاستقراء العكسي عقلانية اللاعبين وتوافر المعلومات الكاملة، ويعمل بشكل أفضل في الألعاب المتتابعة.

ما هو الفرق بين الاستنتاج العكسي والاستنتاج الأمامي؟

تفترض الاستنتاج العكسي أن جميع الإجراءات المستقبلية لكل لاعب ستكون عقلانية ومُحسّنة لتحقيق أقصى عائد، دون النظر في الإجراءات السابقة، وتقوم بتصميم استراتيجية تعمل بشكل عكسي بدءًا من الإجراء الأمثل الأخير. بينما تفترض الاستنتاج الأمامي أن جميع الإجراءات السابقة لكل لاعب كانت عقلانية، وتقوم بتصميم استراتيجية بناءً على التنبؤات حول الإجراءات المستقبلية.

ما هو العيب في الاستنتاج العكسي؟

العيب الرئيسي في الاستنتاج العكسي هو أنه يفترض العقلانية من جانب كل لاعب، ولكن في الحياة الواقعية، الناس ليسوا دائمًا عقلانيين. التوقع باتخاذ قرارات عقلانية لن يحقق دائمًا العائد الأكبر، لأن اللاعبين الآخرين قد يتصرفون استجابةً لتهديدات غير معقولة مقابل تهديدات معقولة. بعبارة أخرى، يتصرفون بشكل غير عقلاني.

الخلاصة

بالنسبة للألعاب المتسلسلة، يوفر الاستقراء العكسي طريقة للتفكير في الإجراءات المثلى طوال اللعبة من خلال البدء بالنهاية. على الرغم من أنه يمكن أن يكون مفيدًا لأنواع معينة من الألعاب، إلا أنه يصبح أقل موثوقية مع زيادة طول اللعبة وتعقيدها؛ كما يفترض وجود عقلانية تامة، في حين أن الألعاب في الحياة الواقعية لا تسير دائمًا بهذه الطريقة.

المصادر

[1]John von Neumann and Oskar Morgenstern. "Theory of Games and Economic Behavior: <em>60th Anniversary Commemorative Edition." </em>Prince University Press, 2004: 60th Anniversary Commemorative Edition."

[2]American Mathematical Society. ": What Is Nash Equilibrium?

[3]Tversky, Amos, and Kahneman, Daniel. ": Advances in Prospect Theory: Cumulative Representation of Uncertainty

[4]University of Oxford. ": Backwards Induction in the Centipede Game

[5]Perea, Andres. ": Backward Induction versus Forward Induction Reasoning

[6]Kamiński, Marek M. ": BACKWARD INDUCTION: MERITS AND FLAWS

#اقتصاد #الاقتصاد #الاقتصاد السلوكي