tradingkey.logo

生成式AI推理運算需求將達到何種規模?瑞銀分析

Investing.com2025年5月11日 08:30

Investing.com — 儘管投資者擔憂關稅問題和AI基礎設施過度支出,瑞銀認為生成式AI(genAI)推理運算需求將在各個板塊大幅擴張。

據該銀行表示,AI仍然對宏觀經濟不確定性具有韌性,主要美國科技公司重申了資本支出(capex)計劃,並強調運算需求繼續超過供應。

瑞銀認為,推理——運行AI模型以生成答案的過程——將成為未來AI運算需求的主要驅動力,超過訓練。

「由於智能代理AI和推理能力的發展,我們現在需要的運算量輕鬆達到去年同期預期的100倍,」英偉達(NASDAQ:NVDA)首席執行官黃仁勳在瑞銀的一份報告中表示。

該銀行呼應了這一觀點,指出思維鏈(Chain of Thought,CoT)推理等更複雜方法的出現是計算強度增長的關鍵來源。

在其預測中,瑞銀列出了四類生成式AI使用案例:聊天機器人、企業AI、智能代理AI和實體AI。

像ChatGPT這樣的聊天機器人的運算需求預計將從2024年的10 exaFLOP/s增加到2030年的200 exaFLOP/s。

對於企業應用,如欺詐檢測和合同摘要,推理需求預計在同期增長更快——從15增加到440 exaFLOP/s。

最顯著的增長預計來自智能代理AI,包括自主客戶支持和工作流程自動化。瑞銀估計,到2030年,這一領域的需求可能攀升至14 zettaFLOP/s,這將是「相較於今天的需求的巨大飛躍,我們估計目前需求在數百exaFLOP/s範圍內,」該公司在報告中表示。

實體AI,包括機器人和自動駕駛車輛,隨著其發展到模擬人類認知的某些方面,最終可能需要yottaFLOP/s範圍的運算能力。

目前安裝的GPU運算能力估計約為4,000 exaFLOP/s(加上Google(NASDAQ:GOOGL)的張量處理單元(TPUs)後達到5,000),但瑞銀指出,其中大部分仍未被充分利用。

GPU記憶體瓶頸等限制意味著實際使用率通常低於名義潛力,這使得目前的基礎設施不太可能滿足未來需求,特別是對於智能代理和實體AI。

「推理通常受到GPU記憶體的限制,這意味著芯片實際能夠提供的FLOP/s遠低於其理論最大值——記憶體限制導致芯片運行效率僅為其名義FLOP/s的25%,」該報告解釋道。

「即使有這些限制,可用容量可能足以滿足當前聊天機器人的需求,但遠低於智能代理和實體AI所需的水平,後者將需要不同數量級的運算能力,」報告補充道。

總體而言,瑞銀認為,推理在AI採用中的擴大角色,加上不斷增長的硬件需求,支持繼續投資AI基礎設施。

對於投資者而言,該銀行認為「與我們的『AI』和『電力和資源』選擇相關的股票出現任何回調都是具吸引力的入場點。」

此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI