搜索





搜索





新闻加密货币

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

金色财经2025年2月23日 02:20

金色财经报道，近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

免责声明：本网站提供的信息仅供教育和参考之用，不应视为财务或投资建议。

推荐文章

SpaceX IPO将近：马斯克解散xAI并入SpaceX 300MW算力转租Anthropic！2万亿估值还能实现吗？

TradingKey - 周三（5月7日），Anthropic与马斯克旗下的SpaceX达成协议，Anthropic将接入SpaceX的大型数据中心“Colossus 1”。该数据中心拥有超过超过300兆瓦（MW）算力资源，相当于22万个英伟达GPU。同时，马斯克表示xAI作为独立公司解散，改名为SpaceXAI，成为SpaceX旗下AI产品线。现在，xAI不仅失去独立公司的身份，也失去其核心算力设施Colossus 1。SpaceX的太空数据中心梦还能实现吗？SpaceX的2万亿估值还能成立吗？

黄金价格预测：美伊局势放缓、非农在即，黄金接下来怎么走？

TradingKey - 金价（XAUUSD）在本周一再度探底4500美元后，周二、周三两个交易日强势反弹超过200美元，并站上4700美元关口上方，截至发稿前，今日（5月7日）金价维持上涨态势，报4748.77美元，接下来黄金价格走势需要格外注意4800美元关口。

美国雅保Q1归母净利暴增672%！锂矿行业景气度回暖提振公司业绩

TradingKey - 锂矿巨头美国雅保于美股盘后时段公布2026年第一季财报。据悉，该公司作为全球最大的锂生产商，其运营业绩不仅是公司自身的数据，更是整个行业的领先指标。期内，美国雅保销售额为14.29亿美元，同比增长33%，略高于市场平均预期。调整后EBITDA录得6.64亿美元，较去年同期的2.67亿美元增长148%，远超市场预期的4.68亿美元。

SK海力士股价突破160万韩元创新高，上涨动力从何而来？

TradingKey - 5月6日亚盘时段，韩国存储芯片巨头SK海力士盘中涨超10%，收盘价超过160万韩元，连续第二个交易日刷新历史纪录。公司市值突破1100万亿韩元以上，年内累计涨幅达到146%以上。

AMD Q1财报：数据中心营收飙升57%驱动业绩超预期，盘后涨超16%

TradingKey - 美东时间5月5日，超威半导体（AMD）于盘后发布2026财年第一季度财报，公司实现营收102.53亿美元，同比增长38%，超出市场预期的98.9亿美元；非GAAP口径下每股收益1.37美元，同比增长43%，同样高于此前预期的1.29美元。

特色工具

marketing_marketsTitle

calendar_economicCalendar

search.intelligent.strategy

article_asider_weekly_report

link

AMD Q1财报：数据中心营收飙升57%驱动业绩超预期，盘后涨超16%

美国雅保Q1归母净利暴增672%！锂矿行业景气度回暖提振公司业绩

SK海力士股价突破160万韩元创新高，上涨动力从何而来？

黄金价格预测：美伊局势放缓、非农在即，黄金接下来怎么走？

WTI原油跌超13%失守90美元！美伊将达成停战备忘录但原油供应短期难恢复

Tradingkey

Tradingkey

KeyAI

