当前,传统药物研发面临周期长、成本高的瓶颈问题。
一款新药从发现到上市通常需要十至十五年时间,研发投入往往超过百亿元。
这一现状主要源于药物研发过程中大量依赖研究人员的手工操作,包括化合物的提取、合成和筛选等环节,试错成本高企。
人工智能技术的应用为破解这一难题提供了新的可能。
通过AI技术,研究人员可以快速分析海量生物医学文献,从数百万种化合物中进行智能筛选,设计优化的临床试验方案,从而在药物研发的各个环节实现加速。
然而,此前的技术应用存在明显不足——药物研发企业使用AI工具需要具备复杂的编码能力,这大大限制了AI在该领域的推广应用。
为解决这一问题,清华大学智能产业研究院与水木分子联合推出了BioMedGPT-Mol模型。
该模型以阿里巴巴千问大模型为基础,通过微调和强化学习等先进训练方法完成开发。
与传统方案不同的是,用户可以通过自然语言对话的方式与模型交互,完成分子描述、性质预测、化学反应预测、分子编辑等多项任务,有效降低了合成化学家和临床研究员的使用门槛。
在性能指标方面,BioMedGPT-Mol表现突出。
该模型在分子描述、性质预测等六大类任务的综合指标上均达到国际先进水平。
特别是在推理模式下,模型在分子编辑任务上实现了进一步的性能提升。
更值得关注的是,水木分子首次探索了仅使用大模型进行端到端有机分子逆合成分析,在RetroBench榜单上也实现了国际先进水平的成绩。
作为服务制药行业的初创企业,水木分子对成本控制和数据安全有着极高的要求。
为此,企业依托阿里云的容器技术和算力虚拟化方案,为模型推理和混合模型部署建立了独立的运行环境,既保障了不同业务的数据安全,又有效降低了推理成本。
同时,通过使用阿里云云效产品,水木分子实现了全部运维流程的云化管理和持续集成持续部署流程的统一管理,进一步减少了运维成本。
根据合作协议,水木分子与阿里云将在专业模型训练、模型推理加速、向量搜索等多个方面开展深入合作,为生物医药领域的AI应用提供更加完善的技术支撑。
这项突破性研究不仅展现了我国在交叉学科领域的技术实力,更开辟了智能技术与生命科学深度融合的新路径。
在创新驱动发展战略引领下,此类关键技术的持续突破,将有力推动我国医药产业向高效化、智能化转型,为全球健康事业贡献中国智慧。
未来如何将技术优势转化为产业优势,仍需产学研各方在标准制定、伦理规范等方面深化协作。