tradingkey.logo

英伟达股票或将从这一新兴 AI 模型趋势中获益

老虎资讯2025年12月9日 01:23

要点

  • 能够记忆并理解更长对话的推理模型,有望在明年提升对 AI 芯片的需求。
  • 英伟达计划于明年推出新的 Rubin CPX,专为超大上下文处理而设计,可处理百万 Token 级的软件编码。
  • Rubin CPX 使用 GDDR7 内存,使其总体拥有成本比使用高带宽内存(HBM)的竞争产品低三倍。

花旗(Citi)的分析师表示,能够记忆和理解更长对话内容的推理模型崛起,可能在明年推高对人工智能芯片和存储芯片的需求。凭借即将推出的新产品,英伟达看起来特别有望从中受益。

上周,亚马逊(AMZN)云服务(AWS)宣布了其 AI 代理平台的“情节式功能”(episodic functionality),允许系统“从过去的经验中学习,并将这些洞察应用于未来互动”,从而提升工具的决策能力。花旗分析师 Atif Malik 在周一的报告中表示,这项更新体现出“记忆是代理智能的关键要素”。

Malik 表示,为了让 AI 代理真正对客户有价值,其记忆能力必须超越短期和长期记忆,能够“理解当前互动的语境”。

11 月,谷歌也公布了一种新的方法,用于改善大型语言模型在持续学习方面的能力,灵感源自人类学习与记忆信息的方式。谷歌使用“嵌套学习”(Nested Learning)的理念来打造 Hope 模型,该模型在“推理、语言建模和记忆管理”等方面优于其他先进模型,Malik 指出。

推理模型需要更大的上下文窗口,以便理解并维持相关对话,Malik 表示,这正是英伟达(NVDA)在 9 月预告的新图形处理器(GPU)所要解决的问题。

Malik 表示,Rubin CPX 有望在明年年底随着 Vera Rubin 平台一起发布,是专为“以最低成本处理超大上下文 Token”而打造的,用于 AI 推理(运行模型)。Token 是 AI 模型处理的数据片段,开发者按输入和输出的 Token 数量收费。

Malik 表示,全新的 Rubin 芯片“让 AI 系统能够以突破性的速度和效率处理百万 Token 的软件编码和生成式视频”,并可与英伟达的 Vera CPU 及 Rubin GPU 协同工作。这意味着转向 Rubin 平台的公司能够“以前所未有的规模将其投资变现”。

他建模估算:客户每投资 1 亿美元,可从 Token 收入中获得 50 倍回报,即 50 亿美元。

Rubin CPX 的另一个优势是它采用 GDDR7 内存,比谷歌 TPU 和亚马逊 Trainium 芯片使用的高带宽内存(HBM)成本更低。Malik 表示,他预计 Rubin CPX 将在明年“让其他 AI 处理器倍感压力”,因为采用 GDDR7 可使其总体拥有成本比 HBM 方案低三倍。

花旗给予英伟达股票“买入”评级,并设定目标价 270 美元。

审核人Huanyao Fang
免责声明:本网站提供的信息仅供教育和参考之用,不应视为财务或投资建议。
Tradingkey

相关文章

Tradingkey
KeyAI