导航:首页>> 快讯>> OpenAI开源HealthBench,60个国家合力开发5000段真实对话

OpenAI开源HealthBench,60个国家合力开发5000段真实对话

来源: jinse 5小时前
金色财经报道,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试,而不是简单的答题或选择题模式。根据测试数据显示,大模型在医疗保健领域的表现有了显著提升。例如,从之前的GPT-3.5Turbo的16%到GPT-4o的32%,再到o3的60%,整体性能有了显著进步。尤其是小型模型的进步更为突出,GPT-4.1nano不仅在性能上超越了GPT-4o,而且成本降低了25倍。
利好
利空
最新快讯
来源:jinse
时间:2025-05-13 12:19:00
5月13日消息,据FT,香港加密投资公司AnimocaBrands正计划在纽约上市。联合创始人YatSiu表示,特朗普政府对加密资产采取宽松监管,为进入全球最大资本市场提供了「独特时机」。Animoc...
来源:jinse
时间:2025-05-13 12:18:00
5月13日消息,据SpotOnChain监测,一位鲸鱼刚刚向Binance存入了800万枚EIGEN(1010万美元),持有仅4天后就可能锁定59.6万美元的利润(+6.34%)。该鲸鱼仍持有1090...
来源:jinse
时间:2025-05-13 12:17:01
7:00-12:00关键词:XRP、Radiant、ZKSync、Curve Finance 1.Curve Finance警告其DNS再次被劫持; 2.数据:2025年XRP持有者数量增长约11...
来源:chaincatcher
时间:2025-05-13 12:16:01
ChainCatcher 消息,据 Spot On Chain 监测,一位鲸鱼刚刚向 Binance 存入了 800 万枚 EIGEN(1010 万美元),持有仅 4 天后就可能锁定 59.6 万美元...
来源:jinse
时间:2025-05-13 12:08:01
金色财经报道,据Farside Investors监测,美国现货以太坊ETF昨日净流出1760万美元。
推荐阅读
最新资讯 查看更多>
  • 交易所
  • 币种
排名 交易所 24h成交额
1 BinanceBinance ¥1,527.57 亿
2 BybitBybit ¥576.23 亿
3 Coinbase ExchangeCoinbase Exchange ¥71.57 亿
4 OKXOKX ¥519.71 亿
5 UpbitUpbit ¥77.13 亿
6 KrakenKraken ¥43.20 亿
7 BitgetBitget ¥494.79 亿
8 RaydiumRaydium ¥11.50 亿
9 BitfinexBitfinex ¥6.09 亿
10 Uniswap v2Uniswap v2 ¥3.72 亿
查看更多
行情行情 行情  平台 平台 平台 首页首页 首页 观点观点 观点   快讯  快讯 快讯