百川智能的医疗大模型,叫baichuan-m3

今天是1月13日,北京传来个好消息。百川智能给全球的人展示了他们新弄出来的医疗大模型,叫Baichuan-M3。这个模型在一个很权威的评测里叫HealthBench,总共得了65.1分,拿了全球第一。特别是那个最难的Hard子项测试,他们得了44.4分,直接把国际领先的GPT-5.2给超越了。 不光分数高,关键是技术上也有大突破。现在AI有时候会乱说话,叫幻觉。这个模型把幻觉率降到了3.5%,是目前最低的。百川智能把医学事实的检查直接放进了训练阶段,让模型知道自己不知道的就不说。这样它就能自己推理了。 最厉害的是,这个模型能像真正的医生一样跟你聊。以前大家都是让AI扮演角色,现在它能主动问你问题,慢慢挖出你身上的毛病。测试显示,它比真人医生问诊还强。王小川说,以前大家都觉得患者说不全话,大模型也不会多问两句。现在他们把这种思维教给了AI,让它必须把关键信息弄到手。 这背后全靠中国科研团队用了新的Scaling Law技术。他们搞了五个月的研发,把系统从半动态反馈改成了全动态验证。就这样一步一步推高了模型的能力。 最近全球都在搞AI医疗。刚开头Anthropic就推出了Claude for Healthcare,OpenAI也发了ChatGPT Health。咱们国产的Baichuan-M3不仅打败了他们,还坚持开源。这让全球的AI医疗生态变得更有活力。 专家说Baichuan-M3强在三个方面:一是把安全理念直接塞进了架构里;二是真的像医生那样问诊;三是性能全面超过国外产品。这说明咱们在这方面已经不是光跟着别人跑了,而是在前面领跑了。 王小川强调说:“咱们的目标不是进医院代替医生,而是帮助大家在家里弄清楚自己的问题。我们要提高大家的健康意识和做决定的能力。”这跟国家的“健康中国2030”规划完全是一个调调。 这次咱们在国际上拿第一,不光是技术进步,也是给全球医疗转型提供了一个中国方案。以后AI肯定能让大家看病更方便、资源分配更合理、健康管理更到位。 不过以后还得看大家怎么一起努力,既要技术先进又要保证安全可靠才行。