记者从相关科研机构获悉,由中国团队主导制定的"临床安全-有效性双轨基准"日前在国际权威期刊《npj Digital Medicine》正式发布。
这是全球首个专门用于评估医疗人工智能临床适用性的权威标准,标志着我国在医疗智能化领域取得重要突破。
长期以来,医疗人工智能评估体系存在明显缺陷。
现有评估方法主要依托标准化考试模式,通过固定答案和有限选项测试系统能力。
然而,真实医疗实践具有高度个体化和动态变化特征,传统评估方式难以准确反映人工智能系统在复杂临床环境中的实际表现。
这种评估标准与临床需求的脱节,成为制约医疗人工智能发展和应用的关键瓶颈。
业内专家指出,随着人工智能技术在诊断、治疗等核心医疗环节的深度应用,建立科学、严谨的评估体系已成为行业发展的迫切需要。
医疗领域关乎生命安全,任何技术应用都必须经过严格验证,确保在提升医疗效率的同时不损害患者利益。
此次发布的评估标准由国内科研团队联合32位顶尖临床专家共同制定,涵盖北京协和医院、中国医学科学院肿瘤医院、中国人民解放军总医院等23家权威医疗机构的核心专科。
该标准创新性地建立了"安全性"与"有效性"双轨评价体系,设置30项核心评估指标,其中17项专注安全性评估,包括危急重症识别、致命性诊断错误防范等关键场景;13项聚焦有效性评估,涵盖多病并存处理、诊疗方案规范性等核心要求。
评估体系采用风险分级加权计分方法,根据临床后果严重程度设定1至5分不等的权重,最高分值对应"潜在致命后果"的高风险情况。
同时,该标准构建了2069个开放式测试条目,覆盖26个临床专科,全面模拟真实诊疗场景的复杂性和多样性。
在基于新标准开展的全球主流人工智能系统测评中,我国自主研发的医疗智能认知系统表现突出,在总体得分、安全性得分、有效性得分三项核心指标中均位居全球首位。
特别值得关注的是,该系统是唯一一款安全性评分高于有效性评分的产品,充分体现了医疗领域所需的谨慎特质和安全意识。
专家分析认为,这一成果的取得得益于我国在医疗人工智能领域的持续投入和技术积累。
近年来,国内相关企业和科研机构深耕医疗场景,注重将先进技术与临床实践紧密结合,在保障安全性的前提下不断提升系统性能。
该评估标准的建立对推动全球医疗人工智能发展具有重要意义。
一方面,它为各国医疗智能系统的研发和优化提供了科学依据和明确方向;另一方面,有助于建立行业共识,促进医疗人工智能技术的规范化应用和国际交流合作。
业界普遍认为,随着评估标准的推广应用,医疗人工智能将更好地服务临床实践,在提高诊疗效率、减少医疗错误、优化资源配置等方面发挥更大作用。
同时,这也将推动相关技术向更高水平发展,为构建智慧医疗体系奠定坚实基础。
医疗人工智能的终极价值在于服务人类健康。
中国科研团队此次在国际标准建设中的突破,不仅展现了科技自立自强的创新实力,更体现了对生命至上的深刻理解。
当技术创新与临床需求真正同频共振,人工智能赋能医疗健康的广阔图景正徐徐展开。