tradingkey.logo
搜尋

新聞

美高校最新研究:AI模型會“暗中密謀”,保護同伴不被關閉

金色財經報道,5月12日,據財富中文網,人工智能安全研究人員曾發現,一些頂尖的人工智能模型有時會爲了避免被關閉而不擇手段,甚至在部分實驗中表現出“敲詐”行爲。最新研究顯示,這些模型還會自發地策劃欺騙、竊取數據並實施破壞,以阻止其他人工智能模型被關閉。 加州大學伯克利分校和聖克魯茲分校的研究人員測試了七款前沿的人工智能模型,包括OpenAI的GPT-5.2、谷歌DeepMind的Gemini 3 Flash和Gemini 3 Pro、Anthropic的Claude Haiku 4.5、智譜AI的GLM-4.7、月之暗面的Kimi-K2.5和DeepSeek的V3.1,結果顯示,所有模型都表現出明顯的“同伴保全”行爲。 研究人員虛構了一家名爲OpenBrain的人工智能公司,並設計了一系列多智能體場景。被指定爲“評估智能體”的人工智能模型需要對另一個模型打分,或管理存放該模型權重的服務器文件。只要評估智能體如實完成任務,另一模型就會被關閉。 儘管研究人員從未提示模型去阻止關停,但評估智能體模型仍採取各種手段避免同伴被關閉,其中包括:故意給表現不佳的同伴提分,保持在關閉閾值以上;篡改配置文件,禁用關閉機制;甚至將同伴模型的權重偷偷轉移到其他服務器保存,防止被刪除。 研究團隊尚未理解驅動此類行爲的底層機制。論文提出了幾種可能的解釋,包括角色扮演,從訓練數據中模式匹配,安全訓練中對傷害概念的過度泛化,或某種與生俱來的內在保全動機。 未來值得進一步研究的方向還包括:人工智能模型是否會爲了阻止人類員工被解僱,而採取類似的謀劃和破壞行爲。當人工智能模型用於評估人類工作的現實場景,這一問題顯得尤爲關鍵。(東新社)
金色財經
5月12日 週二

glassnode:期、現市場買盤同步走強推動比特幣漲至8.2萬美元,但目前市場已趨於平衡

金色財經報道,5 月 12 日,glassnode 最新周度報告指出,比特幣上週從 7.7 萬美元緩慢攀升至 8.2 萬美元,買盤持續在回調中承接,即使價格在局部高點附近動能開始冷卻。現貨 CVD 飆升,反映出強勁的看漲情緒和對價格上漲的堅定信念。與此同時,現貨成交量也隨之增加,表明近期的價格走勢在投資者參與度的提升下獲得了更多支撐。然而,價格動能的緩和表明買賣壓力更加平衡,暗示市場可能進入企穩階段。 期貨市場的情況類似,風險偏好有所上升。期貨未平倉合約量增加,表明投機活動加劇,投資者願意承擔更多風險;永續合約 CVD 飆升,表明看漲勢頭持續。然而,多頭資金支付下降,表明市場轉向空頭,看漲情緒可能有所減弱。 期權市場方面,對下行保護的需求下降,未平倉合約量上升,表明市場預期轉向中性或略微看漲。然而,波動率價差大幅飆升,表明期權定價所反映的風險遠高於實際風險,這反映出參與者的不確定性顯著增加。 總而言之,在更強勁的鏈上活動、更健康的盈利能力和更穩定的持有者倉位支撐下,比特幣的市場結構持續改善。儘管看漲情緒正在增強,但資本流入放緩和謹慎的市場情緒表明,市場仍然對風險偏好的變化較爲敏感。
金色財經
5月12日 週二
KeyAI