
路透北京3月1日 - 中國人工智能(AI)初創公司DeepSeek周六披露了旗下V3/R1模型推理系統在大規模部署中的一些成本和收益數據,聲稱每日可實現理論上高達545%的成本利潤率。這挑戰了行業內的認知,並試圖證明大模型可通過技術優化實現高盈利性。
DeepSeek團隊在“開源周”的過去五天已開源了一些主要的代碼模塊,展現了該公司在其高效模型產品背後的一系列工程優化和創新。不過這個自稱“小而真誠”的團隊顯然沒有停下腳步。
DeepSeek周六發布題為“One More Thing”的X平台推文,並在中國知乎平台專欄文章中稱,假定GPU租賃成本為2美元/小時,DeepSeek V3 和R1模型推理服務的總成本為87,072美元/天。對應的理論上一天的總收入為562,027美元,成本利潤率為545%。
DeepSeek表示,這項統計包括網頁、APP和API的所有負載,統計區間為2月27-28日的24個小時,依據V3/R1推理服務占用多少個GPU服務器節點計算而來,所有tokens全部按照R1的定價計算。
“當然我們實際上沒有這麼多收入,因為V3的定價更低,同時收費服務只占了一部分,另外夜間還會有折扣,”該團隊稱。
據DeepSeek介紹,公司V3和R1大模型的所有服務均使用英偉達NVDA.O的H800 GPU進行。24小時內,V3/R1推理服務平均占用226.75個節點(每個節點為8個H800 GPU)。
該公司還指出,由於白天的服務負荷高,晚上的服務負荷低,因此團隊實現了一套機制,在白天負荷高的時候,用所有節點部署推理服務。晚上負荷低的時候,減少推理節點,以用來做研究和訓練。
DeepSeek表示,其推理系統的優化目標是實現更大的吞吐,更低的延遲。
DeepSeek本周稍早將旗下模型API(應用程序編程接口)調用價格在每日“錯峰”時段大幅下調至多75%。這表明該公司在進一步降低使用成本的同時,有意刺激用戶需求避開高峰時段,並優化服務器資源的利用率。
在以“性價比”特點成功搶占用戶心智後,DeepSeek在2月9日結束了為期45天的優惠期,並將API調用價格恢復至現行水平。不過這一價格相較Open AI等同行提供的同類產品而言依舊極低。
據三位熟悉情況的人士透露,DeepSeek繼1月推出R1後,現正在加快推出後續產品。其中兩位人士透露,Deepseek原計劃在5月初發布R2,但現在希望盡早推出。(完)