上海科学智能研究院与中科院药物所深化合作 探索人工智能驱动生命科学研究新路径

面向新药研发“周期长、成本高、失败率高”的行业痛点,科学智能正从“工具叠加”迈向“范式重塑”。

在这一背景下,上智院发起的NovaClub星河俱乐部近日与中科院上海药物所、同济大学等单位开展对话交流,重点讨论如何把算法能力更深地嵌入真实科研流程,推动生命科学与物质科学在数据、模型与实验之间形成闭环。

问题在于:一方面,药物研发链条长、环节多,从靶点发现到先导化合物优化、从体外验证到安全性评估,任何一环的不确定性都可能导致前期投入付诸东流;另一方面,单点模型在“可解释性、可验证性与可落地性”上仍存在短板,尤其是分子生成、对接与活性预测常受限于可合成性评估不足、数据分布偏差以及跨靶点泛化能力不稳等现实约束。

科研人员普遍期待的是一种以科学问题为中心的集成式解决方案,而不是彼此割裂的算法组件。

原因可从三方面理解。

其一,生命体系本身高度动态复杂,蛋白质并非静止结构,构象变化往往决定了结合口袋的形成与消失,直接影响药物设计成败;其二,药物研发数据类型多样且质量参差,既包含结构数据、反应数据,也包含细胞扰动、转录组和通路互作等多组学信息,传统单模态方法难以充分利用;其三,研发流程对“速度与可靠性”的要求并存:既要在更短时间内筛到更优候选,也要确保结论能经得起实验验证,避免“算得快但不准、准但算不动”的两难。

交流中,多位科研人员给出了各自的路径探索,呈现出“从结构到动态、从靶点到表型、从预测到合成”的协同趋势。

来自同济大学的研究团队分享了在蛋白—配体相互作用预测与分子对接方向的进展,通过相关模型提升结构预测与蛋白柔性建模能力,同时坦陈分子生成模型在可合成性、活性发现效率与泛化能力方面仍需突破,并提出构建统一多模态智能药物推荐系统的设想,力图将分子召回、优化与相互作用预测纳入一体化建模框架,使模型更贴近药物研发的真实工作流。

围绕“动态结构”这一常被忽略的关键环节,上智院生命科学团队则提出蛋白质构象动态对药物设计的重要性,并以病毒融合蛋白等案例说明:若仅依赖静态结构,可能错失真实生物环境中的有效结合态。

相关团队探索利用时空注意力机制预测蛋白质动态轨迹,旨在以更高效率逼近分子动力学模拟所揭示的构象变化过程,为“把动态结构纳入药物设计”提供新的技术路线。

此类研究折射出一个共同方向:让计算从“生成一个结构”扩展到“描述一段运动”,从而更贴近生物体系运行规律。

面对研发端的系统性挑战,上海药物所科研人员从多靶标药物设计与表型药物设计切入,强调单靶点策略在复杂疾病中的局限,提出借助多任务学习、元学习等方法提升激酶谱预测与安全性脱靶评估能力;同时结合化学微扰转录组、知识图谱与通路网络,探索以细胞扰动数据和多组学信息为基础的表型驱动发现策略,以期发现结构新颖且具生物活性的化合物,推动从“靶点导向”到“靶点—表型多尺度联动”的研发模式转变。

在物质科学与化学合成侧,研究人员介绍了面向反应性能预测与合成规划的统一预训练深度学习框架思路,尝试以大规模反应数据训练通用模型,服务于产率预测、路线规划与跨任务迁移等需求。

业内普遍认为,若能把“设计—评估—可合成性—路线规划”更紧密地联结起来,将有望减少从计算结果到实验落地的鸿沟,提高候选分子的真实可实现度。

影响层面看,这类跨机构、跨学科的常态化交流,正在把竞赛训练、方法开发与科研实践串联起来。

活动中提到,部分研究生通过相关赛事把方法直接用于科研问题并取得成绩,反映出“以真实问题牵引、以实践训练促融合”的路径正在形成。

对科研生态而言,这不仅有助于提升青年科研人员的交叉能力,也有助于在机构间建立共享语言与协同机制,推动算法、数据与实验资源更高效对接。

对策方面,受访科研人员的讨论指向几项共识:一是坚持以科学问题为中心,把模型评估从单一指标扩展到“可验证、可解释、可复现、可落地”;二是加强高质量数据与标准体系建设,推动结构数据、反应数据、表型与多组学数据的规范化与联通;三是推进“计算—合成—测试—反馈”闭环,加快将预测结果转化为可操作的实验方案;四是以开放交流机制促进跨学科协作,在药物化学、计算生物学、机器学习与临床需求之间建立更顺畅的协同链条。

前景上看,科学智能在新药研发中的价值将更多体现在“流程再设计”而非“工具替换”:从静态到动态、从单靶点到多尺度、从预测到合成与验证的一体化将成为重要方向。

随着模型能力提升与数据基础夯实,未来有望在病毒性疾病、肿瘤及代谢类疾病等领域加快先导发现与优化迭代,并在更大范围内推动生命科学与物质科学研究范式的协同升级。

当蛋白质的微观动态遇上人工智能的宏观算力,当化学家的合成经验融合数据科学的预测模型,科学探索的边界正在被重新定义。

这场沪上科研机构的跨界对话启示我们:在攻克人类健康难题的征程上,打破学科藩篱的思维碰撞,往往比技术迭代本身更具革命性意义。

这种创新生态的培育,正是建设科技强国的关键支撑。