tradingkey.logo

生成式AI推理计算需求将达到多大规模?瑞银分析

Investing.com2025年5月11日 08:30

Investing.com - 尽管投资者担忧关税和AI基础设施过度支出问题,瑞银认为生成式AI(genAI)推理计算需求有望在各个板块大幅扩张。

据该银行表示,AI仍然对宏观经济不确定性保持韧性,美国主要科技公司重申了资本支出(capex)计划,并强调计算需求继续超过供应。

瑞银认为,推理——即运行AI模型生成答案的过程——将成为未来AI计算需求的主要驱动力,超过训练。

"由于智能代理AI和推理能力的发展,我们需要的计算量轻松比去年同期预计的多出100倍,"Nvidia(NASDAQ:NVDA)首席执行官黄仁勋在瑞银的一份报告中表示。

该银行呼应了这一观点,指出思维链(Chain of Thought,CoT)推理等更复杂方法的出现是计算强度增长的关键来源。

在其预测中,瑞银列出了四类生成式AI用例:聊天机器人、企业AI、智能代理AI和物理AI。

像ChatGPT这样的聊天机器人的计算需求预计将从2024年的10 exaFLOP/s增长到2030年的200 exaFLOP/s。

对于欺诈检测和合同摘要等企业应用,推理需求预计将增长得更快——在同一时期从15增长到440 exaFLOP/s。

最显著的增长预计来自智能代理AI,包括自主客户支持和工作流自动化。瑞银估计,到2030年,这一领域的需求可能攀升至14 zettaFLOP/s,这将是"与今天的需求相比的巨大飞跃,我们估计目前的需求在数百exaFLOP/s范围内,"该公司在报告中表示。

物理AI,包括机器人和自动驾驶汽车,随着其发展到复制人类认知的某些方面,最终可能需要yottaFLOP/s范围的计算能力。

目前安装的GPU计算能力估计约为4,000 exaFLOP/s(加上Google(NASDAQ:GOOGL)的张量处理单元(TPUs)后达到5,000),但瑞银指出,其中大部分仍未被充分利用。

GPU内存瓶颈等限制意味着实际使用率通常低于名义潜力,这使得当前基础设施不太可能满足未来需求,尤其是智能代理和物理AI的需求。

"推理通常受到GPU内存的限制,这意味着芯片能够提供的实际FLOP/s远低于其理论最大值——内存限制导致芯片运行时仅达到其名义FLOP/s的25%左右,"报告解释道。

"即使有这些限制,可用容量可能足以满足当前聊天机器人的需求,但远低于智能代理和物理AI所需的水平,后者将需要不同数量级的计算能力,"报告补充道。

总的来说,瑞银得出结论,推理在AI采用中的扩大作用,加上不断增长的硬件需求,支持继续投资AI基础设施。

对于投资者,该银行认为"与我们的’AI’和’电力与资源’选择相关的股票出现任何回调都是具有吸引力的入场点。"

本文由人工智能协助翻译。更多信息,请参见我们的使用条款。

免责声明:本网站提供的信息仅供教育和参考之用,不应视为财务或投资建议。
Tradingkey

相关文章

KeyAI