TradingKey - 從卷資本支出、卷晶片數量到卷成本,AI大模型競賽現在正在接受貨幣化能力的考驗。在美國科技巨頭仍在燒錢搞AI之際,DeepSeek模型公佈了日賺三百多萬人民幣、利潤率超500%的驚人成本利潤細節。
3月1日週六,DeepSeek團隊在知乎平台上發佈了《DeepSeek-V3/ R1推理系統概覽》,透露了該公司大模型的成本和收益情況。這是首家披露成本結構的大模型開發公司。
據介紹,在DeepSeek統計的最近24小時內(北京時間2月27日12:00至2月28日12:00),該公司運營V3和R1的GPU租賃成本為87072美元(約350萬人民幣),若所有tokens按照R1模型的定價計算,理論上一天的總收入為562027美元,成本利潤率高達545%。
按年算,DeepSeek公司的年收入預計為2億美元以上。
不過,DeepSeek也補充道,實際上並沒有這麼高的收入,因為V3定價更低,且收費服務只佔一部分,夜間也會有折扣。
DeepSeek V3和R1所有服務均使用H800 GPU,使用和訓練一致的精度。這種晶片的性能遠不及OpenAI和其他美國科技巨頭訓練AI所使用的晶片,而DeepSeek卻以更低的價格開發了性能相當的AI模型。
公司稱,DeepSeek V3/ R1推理係統的優化目標是更大的吞吐量、更低的延遲。為此,DeepSeek的方案時使用大規模跨節點專家並行(Expert Parallelism / EP):
按照DeepSeek公佈的成本利潤情況,有投資專家表示,在美國的話,DeepSeek應該是一家估值100億美元的公司。