Google 推出 TurboQuant 壓縮演算法,理論上可大幅降低記憶體使用與提升運算速度,引發半導體類股及亞洲相關股市股價回檔,市場關注此技術是否將削弱 AI 熱潮帶動的 DRAM 與 NAND Flash 需求。高盛認為市場反應合理,投資者正檢驗儲存股走勢。然而,TurboQuant 主要優化推論過程的動態記憶體使用,對模型權重儲存空間影響有限,且 HBM 在 AI 訓練階段仍為剛需,短期內對美光、三星及 SK 海力士等 HBM 巨頭實質影響不大,其最大效應或為為過熱的半導體市場降溫。

TradingKey - 本周早些時候,Google(GOOG)(GOOGL)推出全新極端壓縮演算法 TurboQuant,該演算法有望實現將記憶體使用量降低約 6 倍,並在相同 GPU 配置下提升最高 8 倍的運算速度,引發了半導體類股的集體回檔。
週三美股時段,美光(MU)、SanDisk(SNDK)、威騰電子(WDC)和希捷科技(STX)均下跌,並在週四盤前延續跌勢。
美股的下行壓力也傳導至亞洲股市。週四,三星電子收跌 4.71%,SK 海力士收跌 6.23%,並拖累韓國綜合股價指數 KOSPI 下跌 3.22%。這兩家公司本週以來已連續四連陰。
Google 此項演算法針對大型語言模型(LLM)推論過程中的儲存瓶頸進行最佳化,從而在零精度損失的同時,降低記憶體使用並提升運算速度。然而,此項技術是否將真正顛覆半導體需求?近期影響有多大?
谷歌推出 TurboQuant 演算法的消息迅速獲得市場關注,Cloudflare(NET)執行長 Matthew Prince 稱之為谷歌的 DeepSeek 時刻,AI 技術效率實現了重大的歷史性突破。
華爾街指出,若成功落地,由於儲存需求將大幅下降,可能削弱原本因 AI 熱潮而大幅提升的 DRAM 與 NAND Flash 需求。今年 1 月,三星電子曾將 NAND 快閃記憶體合約價格上調 100% 以上,而在這之前 DRAM 記憶體價格已經上調近 70%,足見半導體市場的火熱。
儘管全球半導體板塊集體降溫,但高盛(GS)科技專家 Peter Callahan 則認為,市場未出現極大恐慌,但這表明投資者已經在對近期儲存股的驚人走勢進行合理性檢驗。
其實在谷歌的 TurboQuant「黑天鵝」爆出之前,市場已經有所行動——儲存巨頭美光在交出強勁財報後,5 天內股價漲幅落後費城半導體指數近 20%,創 2011 年以來最大幅度的短期相對落後。
儘管TurboQuant算法理論上可以降低記憶體需求,但該技術目前仍處於研究階段,且未經過商業化驗證。
從技術層面來看,該技術實際上只適用於推論過程的動態顯示記憶體佔用(主要為 KV Cache),但不涉及模型權重本身。換言之,此項技術最大的突破在於運行效率的提升,但大模型本身需要的儲存空間是無法降低的。
另外,考慮到AI模型參數量也在進行指數級增長,算法目前僅能壓縮節省最多6倍的儲存空間,或等同於杯水車薪。
此項技術的推出,最大的影響莫過於為目前過熱的半導體市場降溫,戳破記憶體股的估值泡沫,證明記憶體的需求或非完全沒有上限。隨著類似技術的推出和算法的進步,記憶體需求的增長可能會面臨瓶頸。
值得一提的是,相比普通DRAM晶片,此項技術對HBM(高頻寬記憶體)影響會更小。TurboQuant主要用於優化AI模型推理,這一階段大多時候只需使用普通的DRAM晶片。但在AI訓練階段,HBM仍是剛需。對於美光、三星電子及SK海力士這三家HBM巨頭而言,TurboQuant算法近期幾乎不會帶來任何實質影響。
本內容經由 AI 翻譯並經人工審閱,僅供參考與一般資訊用途,不構成投資建議。