ما هو اختبار تورينج؟
اختبار تورينغ هو طريقة بسيطة بشكل خادع لتحديد ما إذا كانت الآلة يمكن أن تُظهر ذكاءً بشريًا: إذا تمكنت الآلة من إجراء محادثة مع إنسان دون أن يتم اكتشافها كآلة، فقد أظهرت ذكاءً بشريًا.
تم اقتراح اختبار تورينج في ورقة بحثية نُشرت في عام 1950 من قبل عالم الرياضيات ورائد الحوسبة آلان تورينج. وقد أصبح دافعًا أساسيًا في نظرية وتطوير الذكاء الاصطناعي (AI).
النقاط الرئيسية
- يقيس اختبار تورينج ذكاء الموضوع المختبر لتحديد ما إذا كانت الآلة يمكن أن تظهر ذكاءً.
- وفقًا للاختبار، يمكن لبرنامج الكمبيوتر أن يُعتبر قادرًا على التفكير إذا كانت ردوده تستطيع خداع الإنسان ليعتقد أنه أيضًا إنسان.
- ليس الجميع يقبل بصحة اختبار تورينج، ولكن اجتيازه لا يزال يمثل تحديًا كبيرًا لمطوري الذكاء الاصطناعي.
- هناك تنويعات لاختبار تورينج بالإضافة إلى تعديلات على نهج طرح الأسئلة في اختبارات الذكاء الاصطناعي المختلفة.
- اختبار تورينغ لديه عدة قيود، بما في ذلك الحاجة إلى بيئة محكومة، وعدم وجود تعريف مخصص للذكاء، والحاجة إلى التكيف مع التطورات التكنولوجية المتطورة.
تاريخ اختبار تورينج
طور آلان تورينغ بعض المفاهيم الأساسية لعلوم الحاسوب أثناء بحثه عن طريقة أكثر كفاءة لفك الرسائل الألمانية المشفرة خلال الحرب العالمية الثانية. بعد الحرب، بدأ يفكر في الذكاء الاصطناعي. في ورقته البحثية عام 1950، بدأ تورينغ بطرح السؤال: "هل يمكن للآلات أن تفكر؟" متوقعًا أن تتطور أجهزة الكمبيوتر لتتجاوز القيود الموجودة في ذلك الوقت، صمم تورينغ اختبارًا اعتقد أنه يمكن أن يحدد ما إذا كان الكمبيوتر يمكن أن يكون "ذكيًا" بما يكفي ليُخطئ في اعتباره إنسانًا.
يتم إجراء الاختبار في غرفة استجواب يديرها قاضٍ. يتم إخفاء موضوعي الاختبار، وهما شخص وبرنامج حاسوبي. يجري القاضي محادثة مع كلا الطرفين ويحاول تحديد أيهما هو الإنسان وأيهما هو الكمبيوتر بناءً على جودة المحادثة. يستنتج تورينج أنه إذا لم يستطع القاضي التمييز بينهما، فإن الكمبيوتر قد نجح في إظهار الذكاء البشري. أي أنه يمكنه التفكير.
تم الادعاء بأن العديد من أجهزة الكمبيوتر المبكرة قد خدعت البشر في مواقف بسيطة جدًا. في عام 1966، أنشأ جوزيف وايزنبوم برنامج ELIZA، وهو جهاز كان يأخذ كلمات محددة ويحولها إلى جمل كاملة. كان ELIZA واحدًا من أوائل أجهزة الكمبيوتر التي خدعت المختبرين البشريين ليعتقدوا أنه إنسان.
بعد أقل من عقد من الزمن، تم تصميم روبوت محادثة يُدعى PARRY ليحاكي سلوك شخص مصاب بالفصام البارانويدي. طُلب من مجموعة من الأطباء النفسيين تحليل المحادثات مع مرضى حقيقيين ومحادثات PARRY. عندما طُلب منهم تحديد أي النصوص كانت برامج حاسوبية، تمكنت المجموعة من تحديد الآلة بنسبة 48% فقط من الوقت. يشير النقاد لكل من ELIZA وPARRY إلى أن القواعد الكاملة لاختبار تورينج لم تُستوفَ ولا تشير إلى ذكاء آلي كامل.
اختبار تورينج اليوم
يواجه اختبار تورينغ بعض الانتقادات، لكنه لا يزال يُعتبر مقياسًا لنجاح مشاريع الذكاء الاصطناعي. إحدى النسخ المحدثة من اختبار تورينغ تتضمن أكثر من قاضٍ بشري يقوم بالتحقيق والدردشة مع كلا الموضوعين. يُعتبر المشروع ناجحًا إذا خلص أكثر من 30% من القضاة، بعد خمس دقائق من المحادثة، إلى أن الكمبيوتر هو إنسان.
جائزة لوينر هي مسابقة سنوية لاختبار تورينج تم إطلاقها في عام 1991 بواسطة هيو لوينر، وهو مخترع وناشط أمريكي. قام لوينر بإنشاء قواعد إضافية تتطلب من الإنسان وبرنامج الكمبيوتر إجراء محادثات لمدة 25 دقيقة مع كل من القضاة الأربعة. الفائز هو الكمبيوتر الذي يحصل برنامجه على أكبر عدد من الأصوات وأعلى تصنيف من القضاة.
في عام 2014، نظم كيفين وارويك من جامعة ريدينغ مسابقة لاختبار تورينغ للاحتفال بالذكرى الستين لوفاة آلان تورينغ. وقد نجح برنامج حاسوبي يُدعى يوجين غوستمان، الذي كان يتقمص شخصية صبي يبلغ من العمر 13 عامًا، في اجتياز اختبار تورينغ في ذلك الحدث من خلال الحصول على أصوات 33% من الحكام.
في مشروع بحثي في فبراير 2024، يُقال إن ChatGPT اجتاز اختبار تورينج. ومع ذلك، تمت مقارنة ردود الروبوت الذكي اصطناعيًا بردود عشوائية مأخوذة من طلاب على أسئلة محددة مسبقًا، ثم تم تقييم الردود بناءً على سمات الشخصية "الخمسة الكبرى". وخلص الباحثون إلى أن "سلوك الذكاء الاصطناعي والبشر متشابه بشكل ملحوظ". هذا ليس مفاجئًا، حيث أن تدريب البرنامج شمل مواد مكتوبة من قبل البشر من مجموعة واسعة من المصادر. وبما أنه يستخدم أفكارًا ومعلومات وبيانات مقدمة ومُنشأة من قبل البشر، فإن ردوده ستبدو بطبيعتها بشرية، مما يخلق شكوكًا لدى البعض حول اجتيازه للاختبار. ومع ذلك، يعتقد آخرون أنه اجتازه بالفعل.
إصدارات اختبار تورينج
هناك عدة أنواع من اختبارات تورينج، جميعها تهدف إلى اكتشاف ما إذا كان المجيب إنسانًا أم آلة. كل نوع يتبع نهجًا مختلفًا في طرح أسئلة متنوعة على المجيب وتقييم الإجابات.
لعبة التقليد
إحدى التطبيقات المبكرة لاختبار تورينج، نسخة لعبة التقليد، غالبًا ما تستخدم ثلاثة أطراف. كان الشخص الأول ذكرًا، والشخص الثاني أنثى، والشخص الثالث مسؤول عن تحديد جنس الشخصين الأولين. غالبًا ما يُكلّف الشخص الأول بمحاولة خداع الشخص الثالث، بينما يُكلّف الشخص الثاني بمحاولة مساعدة الشخص الثالث في تحديد كل جنس بشكل صحيح.
لقد تطورت النسخ المستقبلية من لعبة التقليد إلى محاولة كلا الطرفين خداع الشخص الثالث لجعله يحدد الجنسين بشكل غير صحيح. في جميع الأحوال، فإن الهدف من لعبة التقليد هو معرفة ما إذا كان يمكن خداع المحقق.
التفسير القياسي
نسخة شائعة أخرى من اختبار تورينج لا تسعى لمعرفة ما إذا كان يمكن خداع الكمبيوتر، بل لمعرفة ما إذا كان يمكن للكمبيوتر تقليد الإنسان. في التفسير القياسي لاختبار تورينج، يكون الشخص الأول هو الكمبيوتر والشخص الثاني هو الإنسان.
في هذا النوع، يحاول الشخص الثالث اكتشاف أي من الشخصين الأولين هو الإنسان وأيهما هو الكمبيوتر. المحقق ليس هو الموضوع الذي يتم اختباره؛ بدلاً من ذلك، فإن الكمبيوتر هو الذي يحاول خداع الإنسان (على عكس الاتجاه المعاكس في لعبة التقليد). على سبيل المثال، قد يُطلب منه سلسلة من الأسئلة المتعلقة بالتمويل الشخصي لتحديد ما إذا كانت إجاباته متوقعة بشكل معقول فيما يتعلق بـ التمويل السلوكي.
الأساليب الحديثة لاختبار تورينج
منذ إنشاء اختبار تورينج، تطورت أساليب أكثر حداثة في محاولة لتحسين الكشف عن البشر والآلات. هذه التنويعات لاختبار تورينج تتطور باستمرار للحفاظ على أهميتها خلال التقدم التكنولوجي.
- اختبار تورينج العكسي يهدف إلى جعل الإنسان يخدع الكمبيوتر ليعتقد أنه لا يستجوب إنسانًا.
- اختبار تورينج الشامل يتضمن القدرات الإدراكية وقدرة الشخص الذي يتم استجوابه على التعامل مع الأشياء.
- اختبار ماركوس يتضمن مشاهدة المشاركين للوسائط والإجابة على أسئلة حول المحتوى.
- اختبار لوفليس 2.0 يتضمن قيام المشاركين بإنشاء فن ويقوم بفحص قدرتهم على القيام بذلك.
- اختبار الإشارة الذكية الدنيا يطرح على المشاركين أسئلة ثنائية فقط (أي إجابات صحيحة/خاطئة أو نعم/لا).
قيود اختبار تورينج
هناك العديد من النقاد لاختبار تورينج، وتحاول التعديلات المذكورة أعلاه التخفيف من بعض القيود التي يعاني منها اختبار تورينج الأصلي. ومع ذلك، من المهم أن نكون واعين للعيوب التي يعاني منها اختبار تورينج وأين قد تكون تحليلاته غير كافية:
- يتطلب اختبار تورينج بيئة محكمة للغاية ليتم تنفيذه. يجب أن يكون المشاركون في الاختبار مخفيين عن رؤية بعضهم البعض طوال مدة الاختبار، على الرغم من أنه يجب أن يكون لدى الأطراف وسيلة اتصال موثوقة.
- قد لا يكون اختبار تورينج مناسبًا كاختبار للذكاء لأن الأنظمة الحاسوبية المختلفة تكون مهيكلة بطرق مختلفة. لذلك، قد تكون هناك حدود طبيعية متأصلة لما يمكن أن يقوم به الكمبيوتر.
- يقيّم اختبار تورينج الذكاء، رغم أنه قد لا يكون مقياسًا مناسبًا لجميع أنواع الذكاء. على سبيل المثال، قد يتمكن الكمبيوتر من خداع المحقق بناءً على قدرته على معالجة الردود مثل الإنسان. ومع ذلك، قد لا يشير هذا حقًا إلى الذكاء العاطفي أو الوعي؛ قد يعني ببساطة أن برمجة الكمبيوتر تمت بواسطة مبرمج ماهر للغاية.
ما هو اختبار تورينج الأصلي؟
تم استخدام الاختبار الأصلي لتقييم ردود من إنسان وجهاز كمبيوتر مصمم لإنشاء ردود بشرية لخداع القاضي.
هل اجتاز أي ذكاء اصطناعي اختبار تورينج؟
يُعتقد من قبل البعض أن ChatGPT قد اجتاز اختبار تورينج.
ما هو اختبار تورينج المعدل في الذكاء الاصطناعي؟
يتم باستمرار مراجعة اختبار تورينج في محاولات لتحديد أفضل الطرق لتقييم القدرة الشبيهة بالإنسان لدى الحواسيب. تصبح الاختبارات أكثر تعقيدًا مع مرور الوقت.
الخلاصة
اختبار تورينغ هو تقييم لتحديد ما إذا كانت الآلة قادرة على إظهار نفس مستوى الذكاء الذي يتمتع به الإنسان. هناك الآن العديد من الأشكال المختلفة لاختبار تورينغ، ومع استمرار تقدم التكنولوجيا مع الذكاء الاصطناعي في المقدمة، تظهر أفكار جديدة فيما يتعلق بوسائل تحديد الذكاء.