tradingkey.logo

中國DeepSeek發布V3.2實驗性模型、提升長文本訓推效率、API大幅降價

路透社2025年9月29日 13:42

- 中國人工智能初創公司--深度求索(DeepSeek)周一正式發布名為V3.2-Exp的實驗性模型。該公司表示,V3.2-Exp針對長文本訓練和推理效率進行了探索性優化和驗證,並顯著下調官方API(應用程序擴展接口)價格超過50%。

DeepSeek在微信公眾號刊登的新聞稿中稱,作為邁向新一代架構的中間步驟,V3.2-Exp引入了DeepSeek Sparse Attention(一種稀疏注意力機制)。該公司聲稱,這能在幾乎不影響模型輸出效果的前提下,實現長文本訓練和推理效率的大幅提升。

同時,得益於新模型服務成本的大幅降低,官方API價格也相應下調,新價格即刻生效。在新的價格政策下,開發者調用DeepSeek API的成本將降低50%以上。

DeepSeek-V3.2-Exp模型現已在Huggingface與魔搭開源。

DeepSeek公布這款模型後,兩家國產算力芯片公司--華為HWT.UL昇騰和寒武紀 688256.SS分別表示,已經完成對V3.2-Exp模型的適配。

寒武紀在一篇文章中指出,公司一直重視芯片和算法的聯合創新,致力於優化大模型部署性能,降低部署成本。本次適配能夠達到“業界領先“的計算效率水平。

中國本土人工智能產業公司態度已經轉向更加支持國產軟硬件生態。中國工信部9月初發文指出,要加強CPU、高性能人工智能服務器、軟硬件協同等攻關力度,開展人工智能芯片與大模型適應性測試。

DeepSeek在8月下旬宣布對V3基座模型進行升級,新發布的DeepSeek-V3.1模型支持混合推理架構。

上周該公司表示,DeepSeek-V3.1現已更新至DeepSeek-V3.1-Terminus版本,該版本緩解了中英文混雜、偶發異常字符等情況;進一步優化了Code Agent與Search Agent的表現。(完)

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

KeyAI