中國DeepSeek發布V3.2實驗性模型、提升長文本訓推效率、API大幅降價

路透社2025年9月29日 13:42

路透北京9月29日 - 中國人工智能初創公司--深度求索（DeepSeek）周一正式發布名為V3.2-Exp的實驗性模型。該公司表示，V3.2-Exp針對長文本訓練和推理效率進行了探索性優化和驗證，並顯著下調官方API（應用程序擴展接口）價格超過50%。

DeepSeek在微信公眾號刊登的新聞稿中稱，作為邁向新一代架構的中間步驟，V3.2-Exp引入了DeepSeek Sparse Attention（一種稀疏注意力機制）。該公司聲稱，這能在幾乎不影響模型輸出效果的前提下，實現長文本訓練和推理效率的大幅提升。

同時，得益於新模型服務成本的大幅降低，官方API價格也相應下調，新價格即刻生效。在新的價格政策下，開發者調用DeepSeek API的成本將降低50%以上。

DeepSeek-V3.2-Exp模型現已在Huggingface與魔搭開源。

DeepSeek公布這款模型後，兩家國產算力芯片公司--華為HWT.UL昇騰和寒武紀 688256.SS分別表示，已經完成對V3.2-Exp模型的適配。

寒武紀在一篇文章中指出，公司一直重視芯片和算法的聯合創新，致力於優化大模型部署性能，降低部署成本。本次適配能夠達到“業界領先“的計算效率水平。

中國本土人工智能產業公司態度已經轉向更加支持國產軟硬件生態。中國工信部9月初發文指出，要加強CPU、高性能人工智能服務器、軟硬件協同等攻關力度，開展人工智能芯片與大模型適應性測試。

DeepSeek在8月下旬宣布對V3基座模型進行升級，新發布的DeepSeek-V3.1模型支持混合推理架構。

上周該公司表示，DeepSeek-V3.1現已更新至DeepSeek-V3.1-Terminus版本，該版本緩解了中英文混雜、偶發異常字符等情況；進一步優化了Code Agent與Search Agent的表現。（完）

免責聲明：本網站提供的資訊僅供教育和參考之用，不應視為財務或投資建議。

推薦文章