最近,我国企业在医疗AI领域又给大家带来了好消息,他们的一款大模型登上了全球的排行榜第一名。这个模型由北京百川智能科技有限公司研发,名叫Baichuan-M3。它在国际上非常权威的医疗人工智能评测HealthBench里,总分拿到了65.1分,超过了美国OpenAI公司的GPT-5.2模型。而且在更难的HealthBench Hard子项里,它还拿到了44.4分,同样是第一名。这个成绩挺让人惊喜的。 百川智能把这个模型开源了,不光是因为它在分数上领先,技术内核也很厉害。因为医疗场景对信息准确性和安全性要求特别高,大模型有时候会生成不准确或者虚构的信息。百川智能为了解决这个问题,把医疗事实一致性的约束放在了训练模型的核心阶段。通过强化学习的方法,让模型养成了“知之为知之,不知为不知”的好习惯。最终他们把幻觉率控制在3.5%左右,这个水平可是全球最低的呢。 这个模型还有个特点,就是能和医生一样进行严肃的问诊交流。平时患者描述自己情况的时候有时候会说得不清楚、不完整,这就给AI诊断带来了困难。Baichuan-M3可以模拟医生的思维路径,主动追问患者关键的病史和风险信号。这样一来,碎片化、模糊的患者主诉就能变成结构化信息供医学推理用了。测试显示,这项能力比真人医生的平均水平还要强呢。 百川智能的创始人王小川说,“语言”理解和生成能力现在还是核心技术之一,在医疗这种需要专业知识和逻辑推理的领域里更重要。多模态能力虽然也很重要,但是解决医疗AI核心挑战还是得靠语言技术。他强调医疗AI不光是帮医生辅助诊断,还得往院外健康管理、疾病预防和患者教育这些方面发展。主要是为了帮助老百姓降低获取专业知识的门槛,让他们更好地管理自己的健康。 从全球来看,AI医疗现在是各大科技公司都在争抢的赛道。最近OpenAI发布了ChatGPT Health,Anthropic推出了Claude for Healthcare,竞争越来越激烈了。我国企业这次表现不错,而且选择了开源路线。这样不仅显示了技术实力,还能聚集全球开发者的智慧一起推进医疗AI的发展和应用。 这次Baichuan-M3取得的突破,标志着我国在人工智能前沿领域从追赶到局部领先转变了步伐。它也体现了我们把技术发展锚定在服务人民生命健康和坚守安全可信伦理底线上的态度。只有不断夯实基础研究、聚焦真实需求、坚持开放协作才能在这个领域走得更远。 接下来怎么样把技术优势转化成实实在在的医疗服务能力呢?还需要产业界、医疗界还有政策制定者一起努力探索和实践才行。