
中國人工智能初創公司StepFun推出了一款緊湊型人工智能模型Step 3.5 Flash,該公司表示該模型可以與國內競爭對手的大型系統相媲美,加劇了中國快速發展的人工智能領域的競爭。.
這家總部位於上海的公司將此次新版本定位爲證明效率(而非規模)能夠推動高級推理和基於代理的任務的性能。.
StepFun 公司的Step 3.5 Flash AI 的參數比一些競爭對手的產品少得多,例如 Kimi K2.5(1 萬億個參數)和DeepSeek V3.2 (1 萬億個參數)。
然而,在執行的幾個基準測試中,Step 3.5 Flash 已被證明比那些更大的 AI 模型更有用,尤其是在推理、計算機編碼和創建智能代理(能夠以不同智能水平執行任務的代理)的能力方面。.
具體來說,Step 3.5 Flash AI 模型在四個不同的推理基準測試(AIME 2025;IMOAnswerBench 等)中取得了最佳結果,擊敗了 DeepSeek、Moonshot AI、智普 AI 和 MiniMax 產品線中的所有其他模型——唯一的競爭對手是微軟的 OpenAI。
Kimi K2.52、DeepSeek V3.2 以及市面上許多其他 AI 模型都難以與 Step 3.5 Flash 的性能相媲美。參數是模型中使用的各個信息單元,它們構成了模型“智能”的基礎。通常情況下,AI 模型中參數越多,任務性能就越好。.
據StepFun稱,該模型的設計是經過深思熟慮的,其中包含了內置的權衡取捨。首席技術官兼聯合創始人朱一博表示,他們更注重實際應用,而非單純追求技術參數,並指出“邏輯能力、上下文窗口大小和速度對我們來說最爲重要”,以此來描述該系統在人工智能主導的世界中的整體應用目標。.
朱表示,他們根據之前使用較大模型的經驗設計了該模型,因爲較大的模型需要更多的時間進行訓練,因此,交付時間通常比預期要長。.
朱在之前的帖子中也表示,“Step 3.5 Flash 的優勢在於我們最關心的領域:它基於代理的行爲,這將使邏輯推理能夠有效地進行。”
包括華爲和MetaX在內的多家中國半導體公司已經對其芯片的硬件進行了修改,使其與StepFun的新硬件架構兼容,這表明他們對該系統的高效運行充滿信心。.
此次發佈會的時機dent 農曆新年期間新產品和原型機數量的增加,以及中國企業開發或發佈新技術。.
阿里巴巴和Moonshot AI也宣佈將發佈其模型的更新版本;然而,智普和MiniMax仍在致力於開發其產品。.
近期,StepFun成功募集50 億元人民幣(約合 7.2 億美元)。本輪投資方包括政府機構和其他知名企業;這表明,人們越來越相信小型、快速的人工智能模型有潛力主導中國人工智能市場。
如果你正在閱讀這篇文章,你已經領先一步了。訂閱我們的新聞簡報,繼續保持領先優勢。