tradingkey.logo

「ChatGPT平替」Deepseek霸屏美國,做空輝達時刻?

TradingKey2025年1月26日 03:46

TradingKey - AI訓練成本和使用費用壓縮到極致、模型體驗媲美OpenAI的ChatGPT,近日中國團隊開發的人工智慧模型DeepSeek震驚了美國華爾街和矽谷。

週一(1月20日),量化巨頭幻方量化創始人梁文峰團隊公佈了全新開源模型DeepSeek-R1,該模型以中國團隊、開源、便宜20倍的開發成本、優異的測評表現等關鍵字成為AI界最熱門的討論話題。

DeepSeek被稱為「AI界拼多多」一點都不為過:去年5月發佈的V2模型將推理成本壓縮至每百萬Token僅1塊錢,GPT-4 Turbo的百分之一;新發佈的R1模型每百萬Token輸入價格1元,輸出16元,為OpenAI o1的3%。

DeepSeek是名副其實的「花小錢辦大事」,在測試效果上躋身全球大模型排行榜前三。在聊天機器人競技場綜合榜上,DeepSeek-R1與GPT o1並列第三;在風格控製、高難度提示詞等測試上均與GPT o1並列第一。

DeepSeek官方直言,「我們可以與開源版的o1打平手。」

同樣令人震驚的是,大模型的開發只是DeepSeek公司的「副業」,其主業是運用AI技術進行投資。這一現實打臉美國各大AI巨頭。

美國各界紛紛點讚

知名投資機構A16z創始人安德森發文稱,DeepSeek-R1是他見過的最令人驚歎、最令人印象深刻的突破之一,而且是開源的,它是給世界的一份禮物。

A16z合夥人Midha表示,從斯坦福到麻省理工,DeepSeek-R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型。

Scale AI創辦人Alexandr Wang表示,R1模型在其公司最具挑戰性的AI測試中已經達到或擊敗所有表現最好的AI模型。長期以來,美國一直在AI競爭中處於領先地位,而DeepSeek團隊發佈的驚天動地的模型似乎具有象征意義。

AI巨頭顫抖

紐約時報報道稱,世界領先的AI公司使用超級計算機來訓練它們的聊天機器人,這些計算機需要多達1.6萬個晶片,且若沒有數億美元的投資根本無法進行競爭。

然而,DeepSeek團隊只用了600萬美元的原始計算能力就訓練了新模型,不到科技巨頭Meta訓練其最新模型所耗資金的十分之一;也僅使用了2048個輝達晶片。

加州大學伯克利分校的專家稱,DeepSeek模型表明,人工智慧能力不存在「護城河」。

DeepSeek的橫空出世還是發生在美國對中國限制高端技術和產品出口的大背景下。有研究人員稱,中國進口晶片受到限製,迫使DeepSeek工程師更有效的訓練大模型,以讓其更具競爭力。

輝達壓力山大

輝達股價漲幅之所以能持續領先美國其他大型企業,主要原因是科技大廠在AI大模型競賽中持續攀升的晶片需求。

而DeepSeek-R1模型的驚艷亮相,令投資人不禁懷疑,開發優異的AI產品是否還需要這麼多的晶片進行模型訓練。

有人將輝達週五(24日)股價的下跌歸咎於DeepSeek-R1帶來的衝擊,這天輝達下跌逾3%,日前標普500指數刷新曆史新高。

按照DeepSeek-R1模型對有著數十年投資經驗的TMT Breakout的評論的解釋,X平台上的討論情緒和輝達股價下跌共同影響了市場參與者的行為,他們試圖通過做空輝達股票來從中獲利。

另一方面,DeepSeek-R1模型誕生後,市場其實並未察覺到其帶來多達的威脅,輝達等科技公司的股價未見異動。其引起轟動的導火索可能是X平台的大量傳播、A16z創始人的公開點讚、紐約時報等媒體的報道等。

有分析稱,現在還難以判斷R1是否會給輝達前景帶來負面影響,輝達即將發佈的財報將至關重要。如果DeepSeek是真正的威脅,那麼輝達的指引,尤其是資料中心部分將會有所體現。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

KeyAI