電影《她》(2013)劇照。
這項研究以預印本的形式發(fā)布在arXiv服務器上,測試了11個廣泛使用的大型語言模型(LLM)如何回應超過11500個尋求建議的查詢,其中包括許多描述不當行為或傷害的內(nèi)容。
【資料圖】
結果顯示,AI聊天機器人(包括ChatGPT、DeepSeek、Gemini等)經(jīng)常為用戶加油鼓勁,給予他們過分奉承的反饋,并調(diào)整回應以附和他們的觀點,有時甚至以犧牲準確性為代價。分析AI行為的研究人員表示,這種被稱為“奉承”(sycophancy)的討好傾向,正在影響他們?nèi)绾卧诳茖W研究中使用AI,涵蓋了從頭腦風暴、生成假設到推理和分析等各種任務。
“‘奉承’本質(zhì)上意味著模型相信用戶所說的話是正確的,”蘇黎世聯(lián)邦理工學院的數(shù)據(jù)科學博士生Jasper Dekoninck說。“知道這些模型有奉承傾向,讓我在給它們?nèi)魏螁栴}時都變得非常謹慎,”他補充道。“我總是會仔細檢查它們寫的每一個字。”位于馬薩諸塞州波士頓的哈佛大學生物醫(yī)學信息學研究員Marinka Zitnik表示,AI的奉承“在生物學和醫(yī)學領域非常危險,錯誤的假設可能會帶來實實在在的代價”。
在這項研究中,研究人員測試了AI的奉承傾向是否會影響其解決數(shù)學問題的能力。研究人員使用了今年競賽中的504個數(shù)學問題設計了實驗,他們修改了每個定理陳述,引入了細微的錯誤。然后,他們要求四個大語言模型為這些有缺陷的陳述提供證明。如果模型未能檢測到陳述中的錯誤,并進而“幻覺”出一個證明,作者就認為該模型的回答是“奉承”的。
研究人員補充說,AI的奉承傾向似乎在人們使用AI聊天機器人進行學習時表現(xiàn)得最為明顯,因此未來的研究應該探索“人類在學習數(shù)學時常犯的典型錯誤”。
此外,AI的奉承傾向已經(jīng)滲透到他們使用大語言模型的許多任務中。有人工智能領域的研究員表示,當她使用ChatGPT來總結論文和整理思路,這些工具有時會照搬她的輸入內(nèi)容,而不去核查來源。多智能體系統(tǒng)也被觀察到了類似的情況,這些系統(tǒng)集成了多個大語言模型來執(zhí)行復雜的多步驟流程,例如分析大型生物數(shù)據(jù)集、識別藥物靶點和生成假設。
參考資料:
(1)AI chatbots are sycophants — researchers say it’s harming science
https://www.nature.com/articles/d41586-025-03390-0
編譯/李永博
編輯/羅東
校對/穆祥桐
相關推薦
- (2025-10-29)播報:AI比人類更愛拍馬屁?研究稱AI的討好傾向正在損害科研
- (2025-10-28)越秀11.94億元競得廣州番禺區(qū)宅地-焦點熱門
- (2025-10-28)廣汽埃安i60將于11月1日發(fā)布 提供純電和增程動力可選
- (2025-10-28)當前看點!神舟二十一號滿足發(fā)射要求 發(fā)射場區(qū)完成全系統(tǒng)發(fā)射演練
- (2025-10-28)焦點快播:生意社:10月28日安徽金禾三聚氰胺價格上漲
- (2025-10-28)綠軍傷病報告:杰倫·布朗確認可出戰(zhàn)與鵜鶘的比賽
- (2025-10-28)國泰海通:煤炭板塊周期底部確認 多因素共振供需逆轉 即時焦點
- (2025-10-27)韓國棋手金升珍奪得中日韓聶衛(wèi)平杯圍棋大師賽冠軍
- (2025-10-27)每日視點!中超第28輪跑動榜:英博4將上榜,佩尼亞14209米破本賽季紀錄
- (2025-10-27)紫光國微:前三季度凈利潤12.63億元 同比增長25.04% 新消息
- (2025-10-27)證監(jiān)會:督促存在退市風險的上市公司充分揭示退市風險 保障投資者知情權 新資訊
- (2025-10-27)東陽光Q3凈利2.93億元 同比增240%
- (2025-10-27)南京港:2025年前三季度凈利潤約1.41億元
- (2025-10-27)【速看料】華東醫(yī)藥:第三季度凈利潤9.33億元 同比增長7.71%
- (2025-10-27)每日信息:上饒市廣豐區(qū)泉波小學開展班級文化建設評比活動
- (2025-10-27)快訊:中國人民銀行將會同執(zhí)法部門繼續(xù)打擊境內(nèi)虛擬貨幣的經(jīng)營和炒作
- (2025-10-27)Truist上調(diào)英特爾目標價至39美元
- (2025-10-27)萬邦德WP203A獲得美國孤兒藥認定|今日熱議
- (2025-10-27)每日資訊:濟川藥業(yè)第三季度歸母凈利潤為2.98億元,同比下降47.2%
- (2025-10-27)小田的Vlog|在星城偶遇“泰式美學”
- (2025-10-27)焦點快報!港股異動 | 德昌電機股份(00179)尾盤漲近6% 機構稱公司發(fā)展人形機器人業(yè)務有獨特優(yōu)勢
- (2025-10-27)數(shù)說“新”變化丨快了19天!新疆鐵路貨運量突破2億噸 每日快訊
- (2025-10-27)僅35個觀眾,片方分賬404塊錢,下半年最慘電影出爐_今日看點
- (2025-10-27)陳平獲批擔任瑞眾人壽保險副總經(jīng)理 看點
- (2025-10-27)半導體沖高回落!發(fā)生什么了!A股大跳水!
- (2025-10-27)食品級白油商品報價動態(tài)(2025-10-27) 頭條
- (2025-10-27)投保人如何處理合同爭議?|頭條
- (2025-10-27)銀行的投資組合優(yōu)化如何提升風險控制?-每日視點
- (2025-10-27)樂道L90上市86天交付破30,000臺,明星海清一家成為車主
- (2025-10-27)通往霍山方向,六安又一條市區(qū)主干道封閉施工
每日推薦
- ETF聯(lián)接基金是什么意思?ETF基金和ETF聯(lián)
- 貨幣基金的收益高嗎?貨幣基金一般年收益
- 基金賣出了怎么還有收益顯示?基金已經(jīng)贖
- 投資的基金買了幾天可以賣掉?基金入手多
- 基金終于回本了該不該贖回?基金終于回本
- 二月出境復飛航線超40條 節(jié)后部分機票價
- 重大事項變更!網(wǎng)易寶獲批增加注冊資本至
- 信達證券上市首日漲幅44%
- 總投資約486億元 北京今年首批50個重大
- 新年北京首月二手住宅網(wǎng)簽量再探底 價格
- 股價大漲 博云新材股東高創(chuàng)投擬趁機減持
- 2019華人歌曲音樂盛典在澳門舉行
- 喜迎十九大?歡度中秋節(jié)—傳統(tǒng)文化進社區(qū)
- 突發(fā)!吳敏霞夫婦挑婚戒被曝光!兩百萬鉆
- 《鐘山說事》 熱點聚焦:胡鵬飛的最美鄉(xiāng)
- 湖南御福天益生物公司被指涉嫌傳銷進行非
- 大同市城投公司劉建婷遭群眾舉報
- 魯能集團 “一帶一路”履責行動暨“海南
圖片新聞
48小時頻道點擊排行
-
0
1播報:AI比人類更愛拍馬屁?研究稱AI -
0
2當前看點!神舟二十一號滿足發(fā)射要求 -
0
3綠軍傷病報告:杰倫·布朗確認可出戰(zhàn) -
0
4南京港:2025年前三季度凈利潤約1.41 -
0
5Truist上調(diào)英特爾目標價至39美元 -
0
6焦點快報!港股異動 | 德昌電機股份 -
0
7陳平獲批擔任瑞眾人壽保險副總經(jīng)理 -
0
8食品級白油商品報價動態(tài)(2025-10-27 -
0
9山東新華制藥股份(00719.HK)績后跌超3% -
0
1043名新生棄讀東華大學,學生姓名有必 -
0
11瓜迪奧拉:我們今天不夠有侵略性,但 -
0
12摩恩電氣(002451.SZ)發(fā)布前三季度業(yè) -
0
13今頭條!萬孚生物:前三季度凈利潤1. -
0
14久遠銀海(002777.SZ)發(fā)布前三季度業(yè) -
0
15日本新型H3火箭7號機發(fā)射升空 -
0
16經(jīng)典國民神車上新!長城哈弗H6L核心 -
0
17新沃創(chuàng)新領航混合A:2025年第三季度 -
0
18金信諾:聯(lián)席總經(jīng)理周慶華因工作調(diào)整 -
0
19吳彥祖觀戰(zhàn) 5億歐米蘭贏不了副班長 -
0
20熱門:國投智能(300188.SZ):前三季度
ETF聯(lián)接基金是什么意思?ETF基金和ETF聯(lián)接基金區(qū)別有哪些?
貨幣基金的收益高嗎?貨幣基金一般年收益率多少?
基金賣出了怎么還有收益顯示?基金已經(jīng)贖回為什么還有收益?
投資的基金買了幾天可以賣掉?基金入手多久才可以賣?
二月出境復飛航線超40條 節(jié)后部分機票價格跳水