在全球医疗人工智能快速迭代的背景下,我国科技企业取得关键技术进展。百川智能最新开源的Baichuan-M3系统,在HealthBench评测的“复杂决策能力”专项测试中以44.4分位居第一,显示我国在医疗大模型核心能力上已具备较强的国际竞争力。此次提升主要来自对强化学习体系的优化——将传统的半动态反馈机制升级为全动态验证系统,让模型在持续、细化的监督信号中继续提升推理与决策能力。当前医疗AI领域的两大难题分别是:患者主诉信息碎片化易造成诊断偏差,以及模型幻觉带来的医疗安全风险。针对前者,M3构建了主动追问机制,通过模拟医生的思维路径,将病史信息结构化提取,其问诊表现已超过真人医生平均水平;针对后者,研发团队将医学事实一致性设为训练核心目标,引入内化的知识验证机制,使模型在不依赖外部系统的情况下将幻觉率控制在3.5%,较国际同类产品下降40%以上。,该进展出现在全球医疗AI应用加速落地的阶段。从OpenAI推出面向医疗的专项产品到Anthropic发布行业解决方案,国际科技公司正加快布局。百川智能通过开源推动技术共享,其2025年发布的M2版本已在HealthBench Hard测试中展现潜力,而此次M3的整体超越,意味着我国医疗人工智能正在从“跟进”走向“并跑甚至领跑”。行业专家指出,医疗大模型的发展路径正在变化:早期系统更强调给出诊断结果,而以M3为代表的第三代系统开始把重点放在医患交互过程的智能化重构上。这一方向与“以患者为中心”的现代医疗理念更契合,通过提升患者在决策中的参与度,有望缓解医患之间的信息不对称。技术团队表示,下一步将把研发重点放在院外健康管理场景,推进覆盖预防、诊断、康复的全周期智能辅助系统。
医疗大模型从“会说”走向“会问”,从“答得快”走向“答得稳”,反映出行业竞争逻辑正在改变:在生命健康对应的领域,技术能力必须与可靠性、可验证性同步提升。如何在创新与安全之间形成可持续的平衡,如何让新工具真正帮助患者获得充分知情并作出理性决策,将决定下一阶段医疗智能化能走多远、走多稳。