百川智能医疗大模型M3全球领先医学推理能力实现新突破

在全球医疗人工智能快速迭代的背景下，我国科技企业取得关键技术进展。百川智能最新开源的Baichuan-M3系统，在HealthBench评测的“复杂决策能力”专项测试中以44.4分位居第一，显示我国在医疗大模型核心能力上已具备较强的国际竞争力。此次提升主要来自对强化学习体系的优化——将传统的半动态反馈机制升级为全动态验证系统，让模型在持续、细化的监督信号中继续提升推理与决策能力。当前医疗AI领域的两大难题分别是：患者主诉信息碎片化易造成诊断偏差，以及模型幻觉带来的医疗安全风险。针对前者，M3构建了主动追问机制，通过模拟医生的思维路径，将病史信息结构化提取，其问诊表现已超过真人医生平均水平；针对后者，研发团队将医学事实一致性设为训练核心目标，引入内化的知识验证机制，使模型在不依赖外部系统的情况下将幻觉率控制在3.5%，较国际同类产品下降40%以上。，该进展出现在全球医疗AI应用加速落地的阶段。从OpenAI推出面向医疗的专项产品到Anthropic发布行业解决方案，国际科技公司正加快布局。百川智能通过开源推动技术共享，其2025年发布的M2版本已在HealthBench Hard测试中展现潜力，而此次M3的整体超越，意味着我国医疗人工智能正在从“跟进”走向“并跑甚至领跑”。行业专家指出，医疗大模型的发展路径正在变化：早期系统更强调给出诊断结果，而以M3为代表的第三代系统开始把重点放在医患交互过程的智能化重构上。这一方向与“以患者为中心”的现代医疗理念更契合，通过提升患者在决策中的参与度，有望缓解医患之间的信息不对称。技术团队表示，下一步将把研发重点放在院外健康管理场景，推进覆盖预防、诊断、康复的全周期智能辅助系统。

医疗大模型从“会说”走向“会问”，从“答得快”走向“答得稳”，反映出行业竞争逻辑正在改变：在生命健康对应的领域，技术能力必须与可靠性、可验证性同步提升。如何在创新与安全之间形成可持续的平衡，如何让新工具真正帮助患者获得充分知情并作出理性决策，将决定下一阶段医疗智能化能走多远、走多稳。

百川智能医疗大模型M3全球领先 医学推理能力实现新突破

百川智能医疗大模型M3全球领先医学推理能力实现新突破