芯片巨頭英偉達正準備推出一款功能強大的新型人工智能處理器,旨在加快聊天機器人和其他人工智能工具生成響應的速度,與現有的ChatGPT相比,可能會顯得反應遲緩。
預計將在英偉達年度GTC開發者大會上亮相的全新平臺,針對人工智能推理進行了優化,即訓練好的模型對用戶提示做出響應的階段。與傳統GPU兼顧訓練和推理不同,即將推出的這款處理器專注於更快、更高效地提供響應。.
如果該產品上市,這將是去年 12 月達成的交易的第一個切實成果,該交易將Groq 的創始人納入麾下,Groq 是一家專門從事高速人工智能處理硬件的公司。
據報道,英偉達去年底斥資約200億美元從芯片初創公司Groq獲得技術授權,並招募了包括其首席執行官在內的關鍵人才。大約在同一時間,英偉達首席執行官黃仁勳告訴員工:“我們計劃將Groq的低延遲處理器集成到英偉達AI工廠架構中,擴展該平臺以服務於更廣泛的AI推理和實時工作負載。”
據《華爾街日報》報道,這款新型推理芯片有望高速處理複雜的AI查詢, OpenAI
在最近的一次財報電話會議上,英偉達首席執行官暗示,將在即將舉行的GTC大會上發佈幾款新產品,GTC大會通常被稱爲“人工智能界的超級碗”。他曾表示:“我有一些很棒的想法,想在GTC大會上與大家分享。”
大多數分析師都認爲,Groq 風格的芯片可能會成爲產品線的一部分。他們還指出,該芯片的設計或許能揭示英偉達如何解決推理計算中的內存限制問題。這類平臺通常運行在高帶寬內存 (HBM) 上。然而,近來 HBM 的供應一直比較緊張。.
內部人士透露,該公司計劃在芯片中使用靜態隨機存取存儲器(SRAM),而不是與HBM相關的動態隨機存取存儲器(DRAM)。理想情況下,SRAM更易於訪問,並且可以提高人工智能推理工作負載的性能。
如果這款芯片最終發佈,對於芯片公司和人工智能訓練模型而言,都將是一次巨大的飛躍。然而,d-Matrix 的創始人兼首席執行官 Sid Sheth 在談到這款芯片的可能發佈時,卻對其發展前景持保留態度。他指出,儘管 NVIDIA 在人工智能訓練領域仍然遙遙領先,但推理領域的情況卻截然不同。他表示:“開發者可以轉向 NVIDIA 以外的競爭對手,因爲運行已完成的人工智能模型所需的編程難度與訓練模型所需的編程難度並不相同。”
然而,其他科技巨頭也在推進推理計算。本週,Meta公司發佈了四款專爲推理而設計的處理器,這促使一位硅谷投資者表示,該行業可能正在進入一個非“英偉達主導”的階段。.
然而,最近,NVIDIA 的競爭對手 FuriosaAI 的首席執行官 June Paik 在評論易於部署的推理計算的好處時警告說,大多數數據中心無法容納最新的液冷 GPU。.
儘管存在擔憂,美國銀行的分析師預計,到2030年,推理工作負載將佔人工智能數據中心支出的75%,屆時市場規模將達到約1.2萬億美元,高於去年的約50%。Creative Strategies的技術分析師Ben Bajarin也斷言,未來的數據中心不會採用千篇一律的模式,他預計各公司在芯片和設施開發方面將採取不同的方法。.
英偉達近期也推出了其新一代人工智能芯片——Vera Rubin AI芯片,預計DeepSeek將進一步推動計算需求的增長。該公司聲稱,這些芯片將有助於訓練更大規模的人工智能模型,併爲更廣泛的用戶羣體提供更復雜的輸出。
黃表示,Rubin 也將於 2026 年下半年上市,高端“超極”版本將於 2027 年推出。.
他還解釋說,單個 Rubin 系統會將 576 個獨立的 GPU 集成到單個芯片上。目前,NVIDIA 的 Blackwell 芯片在其 NVL72 系統中集成了 72 個 GPU,這意味着 Rubin 將採用更先進的內存。.
如果你正在閱讀這篇文章,你已經領先一步了。訂閱我們的新聞簡報,繼續保持領先優勢。