
要点
花旗(Citi)的分析师表示,能够记忆和理解更长对话内容的推理模型崛起,可能在明年推高对人工智能芯片和存储芯片的需求。凭借即将推出的新产品,英伟达看起来特别有望从中受益。
上周,亚马逊(AMZN)云服务(AWS)宣布了其 AI 代理平台的“情节式功能”(episodic functionality),允许系统“从过去的经验中学习,并将这些洞察应用于未来互动”,从而提升工具的决策能力。花旗分析师 Atif Malik 在周一的报告中表示,这项更新体现出“记忆是代理智能的关键要素”。
Malik 表示,为了让 AI 代理真正对客户有价值,其记忆能力必须超越短期和长期记忆,能够“理解当前互动的语境”。
11 月,谷歌也公布了一种新的方法,用于改善大型语言模型在持续学习方面的能力,灵感源自人类学习与记忆信息的方式。谷歌使用“嵌套学习”(Nested Learning)的理念来打造 Hope 模型,该模型在“推理、语言建模和记忆管理”等方面优于其他先进模型,Malik 指出。
推理模型需要更大的上下文窗口,以便理解并维持相关对话,Malik 表示,这正是英伟达(NVDA)在 9 月预告的新图形处理器(GPU)所要解决的问题。
Malik 表示,Rubin CPX 有望在明年年底随着 Vera Rubin 平台一起发布,是专为“以最低成本处理超大上下文 Token”而打造的,用于 AI 推理(运行模型)。Token 是 AI 模型处理的数据片段,开发者按输入和输出的 Token 数量收费。
Malik 表示,全新的 Rubin 芯片“让 AI 系统能够以突破性的速度和效率处理百万 Token 的软件编码和生成式视频”,并可与英伟达的 Vera CPU 及 Rubin GPU 协同工作。这意味着转向 Rubin 平台的公司能够“以前所未有的规模将其投资变现”。
他建模估算:客户每投资 1 亿美元,可从 Token 收入中获得 50 倍回报,即 50 亿美元。
Rubin CPX 的另一个优势是它采用 GDDR7 内存,比谷歌 TPU 和亚马逊 Trainium 芯片使用的高带宽内存(HBM)成本更低。Malik 表示,他预计 Rubin CPX 将在明年“让其他 AI 处理器倍感压力”,因为采用 GDDR7 可使其总体拥有成本比 HBM 方案低三倍。
花旗给予英伟达股票“买入”评级,并设定目标价 270 美元。