OpenAI开源HealthBench，60个国家合力开发5000段真实对话

2025-05-15407阅读

币安交易所

全球第一大所，币圈用户必备，新用户可得注册奖励最高可达500USD

点击注册进入官网

欧易交易所

全球前三大交易所之一，新用户注册可拆数字盲盒，100%可以获得数字货币

点击注册进入官网

更多交易所入口

一站式注册各大交易所、点击进入加密世界、永不失联，币安Binance/欧易OKX/GATE.IO芝麻开门/Bitget/抹茶MEXC/火币Huobi

点击进入永不失联

币圈财经报道：OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是，该测试集的5000段核心测试对话，全部由来自60个国家/地区的26个专业262名医生打造，极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试，而不是简单的答题或选择题模式。根据测试数据显示，大模型在医疗保健领域的表现有了显著提升。例如，从之前的GPT-3.5Turbo的16%到GPT-4o的32%，再到o3的60%，整体性能有了显著进步。尤其是小型模型的进步更为突出，GPT-4.1nano不仅在性能上超越了GPT-4o，而且成本降低了25倍。

币安交易所

全球第一大所，币圈用户必备，新用户可得注册奖励最高可达500USD

点击注册进入官网

欧易交易所

全球前三大交易所之一，新用户注册可拆数字盲盒，100%可以获得数字货币

点击注册进入官网

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

数币资讯网

OpenAI开源HealthBench，60个国家合力开发5000段真实对话

币安交易所

欧易交易所

更多交易所入口

币安交易所

欧易交易所

更多交易所入口

相关阅读

币安交易所

欧易交易所

更多交易所入口

目录[+]