
金色财经报道,月之暗面公告称,发布Kimi K2 Thinking,我们最强的开源思考模型。作为一个思考模型,Kimi K2 Thinking在使用工具的同时一步一步地进行推理,在HLE、BrowseComp和其他基准测试中取得了最先进的表现,在推理、代理搜索、编码、写作和一般能力方面取得了重大进展。Kimi K2 Thinking可以在没有人为干扰的情况下执行多达200 - 300个连续的工具调用,在数百个步骤中进行连贯的推理,以解决复杂的问题。 在人类终极考试( HLE)这项超难基准上,Kimi K2 Thinking 取得44.9%的分数,超过了Grok4、GPT-5、Claude 4.5等先进模型。如果是 Kimi K2 Thinking Heavy,分数还可以进一步达到 51%。(金十)