
金色財經報道,月之暗面公告稱,發佈Kimi K2 Thinking,我們最強的開源思考模型。作爲一個思考模型,Kimi K2 Thinking在使用工具的同時一步一步地進行推理,在HLE、BrowseComp和其他基準測試中取得了最先進的表現,在推理、代理搜索、編碼、寫作和一般能力方面取得了重大進展。Kimi K2 Thinking可以在沒有人爲干擾的情況下執行多達200 - 300個連續的工具調用,在數百個步驟中進行連貫的推理,以解決複雜的問題。 在人類終極考試( HLE)這項超難基準上,Kimi K2 Thinking 取得44.9%的分數,超過了Grok4、GPT-5、Claude 4.5等先進模型。如果是 Kimi K2 Thinking Heavy,分數還可以進一步達到 51%。(金十)