导航:首页>> 快讯>> OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

来源: jinse 66天前
金色财经报道,近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
利好
利空
最新快讯
来源:jinse
时间:2025-05-01 00:47:00
金色财经报道,美国总统特朗普表示,目前正在酝酿的“美丽大法案”(big beautiful bill)可能“比关税还要大”。特朗普赞扬了美国参议院多数党领袖图恩在立法方面所做的工作,并补充说,民主党人...
来源:jinse
时间:2025-05-01 00:46:00
金色财经报道,美国总统特朗普谈贸易协议:我认为我们做得很好。 此前消息,美国总统特朗普表示,关税尚未生效。
来源:chaincatcher
时间:2025-05-01 00:35:00
ChainCatcher 消息,美国总统特朗普:即将有一个“漂亮的大法案”,可能比关税还大。对于贸易协议特朗普表示:我认为我们做得很好。(金十)
来源:jinse
时间:2025-05-01 00:34:01
金色财经报道,Coinbase宣布已停止 Maple(MPL)的交易,但用户仍然可以使用资金,并且继续能够随时提取资金。Coinbase补充表示,Maple (MPL)已迁移到其代币的新版本SYRUP...
来源:jinse
时间:2025-05-01 00:32:00
金色财经报道, Coinbase 将在以太坊网络(ERC-20 代币)上增加对 Mantle (MANTLE)的支持,如果满足流动性条件,交易将于太平洋时间 2025 年 5 月 1 日上午 9 点或...
最新文章
最新资讯 查看更多>
  • 交易所
  • 币种
排名 交易所 24h成交额
1 BinanceBinance ¥1,527.57 亿
2 BybitBybit ¥576.23 亿
3 Coinbase ExchangeCoinbase Exchange ¥71.57 亿
4 OKXOKX ¥519.71 亿
5 UpbitUpbit ¥77.13 亿
6 KrakenKraken ¥43.20 亿
7 BitgetBitget ¥494.79 亿
8 RaydiumRaydium ¥11.50 亿
9 BitfinexBitfinex ¥6.09 亿
10 Uniswap v2Uniswap v2 ¥3.72 亿
查看更多
行情行情 行情  平台 平台 平台 首页首页 首页 观点观点 观点   快讯  快讯 快讯