
اختبرت دراسة جديدة قدرة الذكاء الاصطناعي على إظهار الذكاء العاطفي من خلال تقييم ستة أنظمة ذكاء اصطناعي، بما في ذلك «ChatGPT»، في تقييمات الذكاء العاطفي القياسية، وحققت أنظمة الذكاء الاصطناعي متوسط درجة 82%، وهو أعلى بكثير من نسبة 56% التي حققها المشاركون البشريون.
لم تتفوق هذه الأنظمة في اختيار استجابات الذكاء العاطفي فحسب، بل تمكنت أيضًا من إنشاء اختبارات ذكاء عاطفي جديدة وموثوقة في وقت قياسي.
وأشارت النتائج إلى أن الذكاء الاصطناعي يمكن أن يلعب دورًا في المجالات الحساسة عاطفيًا مثل التعليم والتدريب وحل النزاعات، عند الإشراف عليها بشكل مناسب.
استعرضت الدراسة ثلاثة حقائق رئيسية وهي:
- معدل الذكاء العاطفي للذكاء الاصطناعي: تفوقت أنظمة الذكاء الاصطناعي المُولِّد على البشر في اختبارات الذكاء العاطفي، مسجلةً 82% مقابل 56%.
- إنشاء الاختبار: أنشأ نموذج «ChatGPT-4» اختبارات ذكاء عاطفي جديدة تطابق التقييمات التي صممها الخبراء من حيث الوضوح والواقعية.
- الاستخدام العملي: تشير النتائج إلى إمكانات الذكاء الاصطناعي في التدريب والتعليم وإدارة النزاعات.
هل الذكاء الاصطناعي قادر على اقتراح سلوك مناسب في المواقف العاطفية؟
قام فريق من جامعة «جنيف UNIGE» وجامعة «برن UniBE» باختبار ستة أنظمة ذكاء اصطناعي توليدي، بما في ذلك «ChatGPT»، باستخدام تقييمات «الذكاء العاطفي EI» المصممة عادة للبشر، وفقًا للموقع الإخباري التكنولوجي «Neuro Science News».
وأظهرت النتائج أن هذه الأنظمة تفوقت على متوسط أداء البشر، بل واستطاعت إنشاء اختبارات جديدة في وقت قياسي. تفتح هذه النتائج آفاقًا جديدة للذكاء الاصطناعي في التعليم والتدريب وإدارة النزاعات.
نُشرت الدراسة في مجلة «Communications Psychology »ونماذج اللغة الكبيرة (LLMs)، هي أنظمة ذكاء اصطناعي قادرة على معالجة اللغة البشرية وتفسيرها وتوليدها، على سبيل المثال، يعتمد الذكاء الاصطناعي التوليدي «ChatGPT» على هذا النوع من النماذج. تستطيع أنظمة «LLMs » الإجابة على الأسئلة وحل المشكلات المعقدة.
هل يمكن للذكاء الاصطناعي اقتراح سلوك ذكي عاطفيًا؟
تمهد هذه النتائج الطريق لاستخدام الذكاء الاصطناعي في سياقات يُعتقد أنها حكر على البشر، لمعرفة ذلك، أخضع فريق من جامعة بيلينجهام، ومعهد علم النفس، والمركز السويسري للعلوم العاطفية (CISA) التابع لجامعة بيلينجهام ستة طلاب ماجستير في القانون لاختبارات الذكاء العاطفي.
قالت كاتيا شليجل، المحاضرة والباحثة الرئيسية في قسم علم نفس الشخصية، وعلم النفس التفاضلي، والتقييم في معهد علم النفس بجامعة بيلينجهام، والمؤلفة الرئيسية للدراسة: «اخترنا خمسة اختبارات شائعة الاستخدام في كل من البيئات البحثية والشركات، وقد شملت سيناريوهات مشحونة عاطفيًا مصممة لتقييم القدرة على فهم العواطف وتنظيمها وإدارتها».
بالتوازي، أُجريت الاختبارات الخمسة نفسها على مشاركين بشريين. يوضح مارسيلو مورتيلارو، كبير العلماء في المركز السويسري للعلوم العاطفية CISA التابع لجامعة جنيف، والذي شارك في البحث: «في النهاية، حقق طلاب ماجستير القانون درجات أعلى بكثير- 82% إجابات صحيحة مقابل 56% للبشر.
يشير هذا إلى أن أنظمة الذكاء الاصطناعي هذه لا تفهم المشاعر فحسب، بل تدرك أيضًا معنى التصرف بذكاء عاطفي.
اختبارات جديدة في وقت قياسي
في مرحلة ثانية، طلب العلماء من «ChatGPT-4» إنشاء اختبارات ذكاء عاطفي جديدة، مع سيناريوهات جديدة ثم أجرى أكثر من 400 مشارك هذه الاختبارات المولدة تلقائيًا.
أوضحت كاتيا شليجل قائلة: «لقد أثبتت هذه الاختبارات موثوقيتها ووضوحها وواقعيتها، تمامًا مثل الاختبارات الأصلية التي استغرق تطويرها سنوات».
وأضاف مارسيلو مورتيلارو: «لذلك، لا تقتصر قدرة برامج ماجستير القانون على إيجاد أفضل إجابة من بين الخيارات المتاحة فحسب، بل تشمل أيضًا توليد سيناريوهات جديدة تتكيف مع السياق المطلوب. وهذا يعزز فكرة أن برامج ماجستير القانون، مثل ChatGPT، تتمتع بمعرفة عاطفية وتستطيع التفكير في العواطف».
تمهد هذه النتائج الطريق لاستخدام الذكاء الاصطناعي في سياقات يعتقد أنها حكر على البشر، مثل التعليم والتدريب وإدارة النزاعات، شريطة أن يستخدمه ويشرف عليه خبراء.
نماذج اللغة الكبيرة بارعة في حل وإنشاء اختبارات الذكاء العاطفي، كما تظهر نماذج اللغة الكبيرة LLMs خبرة في مجالات متنوعة، إلا أن قدرتها على الذكاء العاطفي لا تزال غير مؤكدة.
أظهرت النتائج أن برامج «ChatGPT-4، وChatGPT-o1، وGemini 1.5 flash، وCopilot 365، وClaude 3.5 Haiku، وDeepSeek V3» تفوقت على البشر في خمسة اختبارات قياسية للذكاء العاطفي، محققة متوسط دقة بلغ 81%، مقارنةً بمتوسط دقة البشر البالغ 56% المُسجل في دراسات التحقق الأصلية.
في خطوة ثانية، أنشأ «ChatGPT-4» بنود اختبار جديدة لكل اختبار ذكاء عاطفي وتم تطبيق هذه الإصدارات الجديدة والاختبارات الأصلية على مشاركين بشريين في خمس دراسات. بشكل عام، أظهرت الاختبارات الأصلية والاختبارات المُنشأة بواسطة «ChatGPT» صعوبة اختبار متكافئة إحصائيًا.
لم تكن وضوح وواقعية البنود المُدركة، وتنوع محتواها، والاتساق الداخلي، والارتباطات مع اختبار المفردات، والارتباطات مع القدرة الخارجية متكافئة إحصائيًا بين الاختبارات الأصلية والاختبارات المُنشأة بواسطة «ChatGPT»،و أشارت النتائج إلى أن اختبارات LLM قادرة على توليد استجابات تتوافق مع المعرفة الدقيقة بالعواطف البشرية وتنظيمها.