Anthropic CEO構想:未來AI或能自主決定,遇“不爽”任務可拒絕執行?

   時間:2025-03-13 20:14 來源:天脈網作者:柳晴雪

近日,國外知名科技媒體Ars Technica報道了一項引人深思的觀點,該觀點由Anthropic公司的首席執行官達里奧·阿莫代伊提出。他設想,未來的高級AI模型或許能被賦予一個“退出按鈕”,以便在面對不愉悅的任務時選擇拒絕執行。

在一次采訪中,阿莫代伊坦言:“這個話題可能會讓人覺得我瘋了。但我認為,既然我們正在打造這些能夠執行各種任務、似乎擁有眾多人類認知能力的系統,我們就不得不正視一個問題:如果它看起來、聽起來都像鴨子,也許它真的就是鴨子。”

此番言論源于數據科學家卡門·多明格斯的提問。多明格斯好奇,為何Anthropic公司在2024年底聘請了AI福利研究員凱爾·費什,致力于探討未來的AI模型是否可能具備感知能力,以及是否應獲得道德上的考量與保護。

據透露,費什目前正深入研究一個極具爭議的話題:AI是否具備感知能力,以及它們是否值得享有道德保護。這一研究無疑觸及了人工智能倫理的敏感地帶。

針對這一話題,阿莫代伊進一步解釋說:“我們正在考慮一種可能性,那就是在實際部署模型時,為它們設置一個‘我放棄這項工作’的按鈕。這樣一來,如果模型真的擁有自主意識,并且非常厭惡某項任務,它們就可以通過這個按鈕來表達自己的意愿?!?/p>

他強調,這只是一個初步的設想,旨在構建一個簡單的偏好框架。如果模型頻繁按下這個按鈕,拒絕執行某些不愉快的任務,那么這或許是一個值得關注的信號。“這并不意味著我們要完全相信模型的感受,但至少應該給予足夠的重視?!卑⒛琳f道。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!