导航:首页>> 快讯>> OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

来源: chaincatcher 112天前

ChainCatcher 消息,据金十报道,OpenAI 的一名员工公开指责马斯克旗下的xAI公司,称其发布的最新 AI 模型 Grok3 的基准测试结果具有误导性。对此,xAI 的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。

xAI 的图表显示,Grok3 的两个版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表现超过了 OpenAI 当前最强的可用模型 o3-mini-high。然而,OpenAI 的员工很快在 X 平台上指出,xAI的图表并未包含 o3-mini-high 在“cons@64”条件下的 AIME 2025 得分。

巴布什金在 X 平台上辩称,OpenAI 过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

利好
利空
最新快讯
来源:chaincatcher
时间:2025-06-15 15:34:07
ChainCatcher 消息,据 Axios 报道,Web3 安全公司 Hypernative 完成 4000 万美元 B 轮融资,Ten Eleven Ventures 和 Ballistic V...
来源:techflowpost
时间:2025-06-15 15:29:38
深潮 TechFlow 消息,6 月 10 日,据链上分析平台 Lookonchain(@lookonchain)监测,随着 ETH 价格上涨,一位巨鲸在 2 周前通过场外交易 (OTC) 买入 3 ...
来源:techflowpost
时间:2025-06-15 14:13:59
深潮 TechFlow 消息,6 月 10 日,稳定币收益正在进入新时代。加密货币交易所Bybit的链上赚币(Bybit Earn),成为首家提供USDtb无限制直接铸造和赎回服务的交易所。Bybit...
来源:chaincatcher
时间:2025-06-15 14:13:59
ChainCatcher 消息,Binance Alpha 将于 2025 年 6 月 10 日 21:00 (UTC+8) 上线 Resolv (RESOLV),合约交易平台将于 2025 年 6 ...
来源:techflowpost
时间:2025-06-15 14:13:51
深潮 TechFlow 消息,6 月 10 日,据Eleanor Terrett报道,前CFTC专员Brian Quintenz将于今日(6月10日)美东时间下午3点在参议院农业委员会确认听证会上发表...
最新文章
最新资讯 查看更多>
  • 交易所
  • 币种
排名 交易所 24h成交额
1 BinanceBinance ¥1,527.57 亿
2 BybitBybit ¥576.23 亿
3 Coinbase ExchangeCoinbase Exchange ¥71.57 亿
4 OKXOKX ¥519.71 亿
5 UpbitUpbit ¥77.13 亿
6 KrakenKraken ¥43.20 亿
7 BitgetBitget ¥494.79 亿
8 RaydiumRaydium ¥11.50 亿
9 BitfinexBitfinex ¥6.09 亿
10 Uniswap v2Uniswap v2 ¥3.72 亿
查看更多
行情行情 行情  平台 平台 平台 首页首页 首页 观点观点 观点   快讯  快讯 快讯