人工智能能否比我們更好地理解情緒?
人工智能(AI)能否在情感緊張的情境中提出適當?shù)男袨榻ㄗh?日內(nèi)瓦大學(UNIGE)和伯爾尼大學(UniBE)的一個研究團隊使用通常為人類設計的情商(EI)評估方法,對包括 ChatGPT 在內(nèi)的六個生成式 AI 進行了測試。結(jié)果:這些 AI 的表現(xiàn)優(yōu)于普通人類水平,甚至能夠在創(chuàng)紀錄的時間內(nèi)生成新的測試。這些發(fā)現(xiàn)為 AI 在教育、輔導和沖突管理中的應用開辟了新的可能性。這項研究發(fā)表在《 心理學交流 》期刊上。
本文引用地址:http://www.2s4d.com/article/202505/470819.htm大型語言模型(LLMs)是能夠處理、解釋和生成人類語言的人工智能(AI)系統(tǒng)。例如,ChatGPT 生成式人工智能就是基于這種模型。LLMs 可以回答問題并解決復雜問題。但它們也能提出具有情商的行為嗎?
這些結(jié)果為 AI 在以往被認為是人類專屬的領(lǐng)域中的應用鋪平了道路。
情感緊張的情境
為了找出答案,來自 UniBE 心理學研究所和 UNIGE 瑞士情感科學中心(CISA)的一個團隊對六個大型語言模型(LLMs)(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)進行了情商測試?!拔覀冞x擇了五種在研究和企業(yè)環(huán)境中常用的測試。它們涉及充滿情感的場景,旨在評估理解、調(diào)節(jié)和管理情緒的能力,”UniBE 心理學研究所人格心理學、差異心理學和評估系的講師兼首席研究員 Katja Schlegel 說,也是該研究的主要作者。
例如:邁克爾的一個同事偷了他的想法,并且正在不公平地受到祝賀。邁克爾最有效的反應是什么?
a) 與涉及的同事爭論
b) 和他的上級談談情況
c) 悄悄地怨恨他的同事
d) 偷回一個想法
這里,選項 b 被認為是最合適的。
同時,相同的五項測試也 administered 給人類參與者。"最終,LLMs 獲得了顯著更高的分數(shù)——82%的正確答案,而人類只有 56%。這表明這些 AI 不僅理解情緒,而且理解這意味著什么,以具有情緒智能的行為",參與研究的 UNIGE 瑞士情感科學中心(CISA)高級科學家 Marcello Mortillaro 解釋道。
新測試在創(chuàng)紀錄的時間內(nèi)完成
在第二階段,科學家們要求 ChatGPT-4 創(chuàng)建新的情商測試,并設計了新的場景。這些自動生成的測試由 400 多名參與者進行。 “它們與原始測試一樣可靠、清晰和逼真,而原始測試的開發(fā)花費了數(shù)年時間,”卡特婭·施萊格爾解釋道?!耙虼耍琇LMs 不僅能夠從各種選項中找到最佳答案,還能夠生成適應所需上下文的新場景。這進一步證實了 LLMs,如 ChatGPT,具有情感知識并能夠推理情感,”馬塞洛·莫蒂拉羅補充道。
這些結(jié)果為 AI 在原本被認為是人類專屬的領(lǐng)域中的應用鋪平了道路,例如教育、輔導或沖突管理,前提是它由專家使用和監(jiān)督。
評論