谷歌推出的TurboQuant算法旨在优化大型语言模型推论过程的存储瓶颈,理论上可将内存使用量降低约6倍并提升运算速度。此消息引发半导体板块回调,三星电子、SK海力士等亚洲股市及美光、西部数据等美股均出现下跌。然而,该技术目前仅处于研究阶段,主要优化动态显存占用,对模型权重存储影响有限。鉴于AI模型参数量持续增长,该算法的压缩效果可能不足以大幅削弱DRAM与NAND Flash需求。此外,TurboQuant对训练阶段所需的HBM影响不大,对HBM巨头三星、SK海力士及美光影响有限。此技术更多被视为对当前半导体市场过热现象的警示。

TradingKey - 本周早些时候,谷歌(GOOG)(GOOGL)推出全新极端压缩算法TurboQuant,该算法有望实现将内存使用量降低约6倍,并在相同GPU配置下提升最高8倍的运算速度,引发了半导体板块的集体回调。
周三美股时段,美光(MU)、闪迪(SNDK)、西部数据(WDC)和希捷科技(STX)均下跌,并在周四盘前延续跌势。
美股的下行压力也传导至亚洲股市。周四,三星电子收跌4.71%,SK海力士收跌6.23%,并拖累韩国综合股价指数KOSPI下跌3.22%。这两家公司本周以来已连续四连阴。
谷歌此项算法针对大型语言模型(LLM)推论过程中的存储瓶颈进行最优化,从而在零精度损失的同时,降低内存使用并提升运算速度。然而,此项技术是否将真正颠覆半导体需求?近期影响有多大?
谷歌推出TurboQuant算法的消息迅速获得市场关注,Cloudflare(NET)执行长Matthew Prince称之为谷歌的DeepSeek时刻,AI技术效率实现了重大的历史性突破。
华尔街指出,若成功落地,由于存储需求将大幅下降,可能削弱原本因AI热潮而大幅提升的DRAM与NAND Flash需求。今年1月,三星电子曾将NAND闪存合约价格上调100%以上,而在此之前DRAM内存价格已经上调近70%,足见半导体市场的火热。
尽管全球半导体板块集体降温,但高盛(GS)科技专家Peter Callahan则认为,市场未出现极大恐慌,但这表明投资者已经在对近期存储股的惊人走势进行合理性检验。
其实在谷歌的TurboQuant“黑天鹅”爆出之前,市场已经有所行动——存储巨头美光在交出强劲财报后,5天内股价涨幅落后费城半导体指数近20%,创2011年以来最大幅度的短期相对落后。
尽管TurboQuant算法理论上可以降低内存需求,但该技术目前仍处于研究阶段,且未经过商业化验证。
从技术层面来看,该技术实际上只适用于推论过程的动态显存占用(主要为 KV Cache),但不涉及模型权重本身。换而言之,此项技术最大的突破在于运行效率的提升,但大模型本身需要的存储空间是无法降低的。
另外,考虑到AI模型参数量也在进行指数级增长,算法目前仅能压缩节省最多6倍的存储空间,或等同于杯水车薪。
此项技术的推出,最大的影响莫过于为目前过热的半导体市场降温,戳破存储股的估值泡沫,证明内存的需求或非完全没有上限。随着类似技术的推出和算法的进步,存储需求的增长可能会面临瓶颈。
值得一提的是,相比普通DRAM芯片,此项技术对HBM(高带宽内存)影响会更小。TurboQuant主要用于优化AI模型推理,这一阶段大多时候只需使用普通的DRAM芯片。但在AI训练阶段,HBM仍是刚需。对于美光、三星电子及SK海力士这三家HBM巨头而言,TurboQuant算法近期几乎不会带来任何实质影响。