微软推出 Phi-4，一种新的生成式 AI 模型 - 这是软件包

Cryptopolitan2024年12月13日 09:03

Phi-4：增强matic推理能力

微软将 Phi-4 定位为解决matic问题的领导者，并指出其性能比其前身和同类模型都有显着提升。据报道 Phi-4 在多项标准化基准测试中取得最高分后，该公司对人工智能模型的能力dent。

微软推出 Phi-4，一种新的生成式 AI 模型 - 这是软件包 — *来源：微软*

在 GPQA 测试中，它的得分为 56.1，超过了 GPT-4o 的 40.9 分和 Llama-3 的 49.1 分。在 MATH 基准测试中，Phi-4 取得了 80.4 分，体现了其解决复杂matic问题的先进能力。它还在编码基准测试中表现出色，在 HumanEval 上获得了 82.6 分。

此外，Phi-4 在现实场景中展示了其强大的能力，包括在美国matic协会的美国matic竞赛 (AMC-10/12) 问题上获得高分。这些结果表明了其在科学研究、工程和金融建模等matic准确性和推理至关重要的领域的潜在应用。

虽然 OpenAI 的 GPT-4o 和 Google 的 Gemini Ultra 等较大模型需要处理数千亿甚至数万亿个参数，但 Phi-4 表明更小的、简化的架构可以在专门任务中实现卓越的性能。

微软将 Phi-4 的进步归功于高质量合成数据与人类生成内容数据集的集成，以及训练后未公开的改进。这些努力反映了人工智能行业更广泛的趋势，研究团队越来越关注合成数据使用和训练后优化方面的创新。

Scale AI 首席执行官 Alexandr Wang 最近强调了这一转变，他表示该行业已经遇到了“预训练数据墙”，并补充说公司现在将竞相开发更高效的人工智能模型。

计算很重要，但数据也很重要，我们已经达到了预训练数据墙。

为培训后数据热潮做好准备。公司将竞相拥有最好的前沿数据——多模式、代理、复杂推理等等。

跟踪数据，找到赢家。

7/8

—亚历山大·王 (@alexandr_wang) 2024 年 12 月 12 日