问题:基础模型竞争日趋激烈,高质量数据、跨学科协作与工程化能力成为关键。基因组基础模型需要兼顾生命科学的复杂规律与大规模训练、推理效率等工程要求,单一团队往往难以覆盖数据治理、模型架构、评测体系等全链条能力。如何在有限时间内建立持续迭代的攻关体系,成为科研组织面临的新挑战。 原因:2024年起,之江实验室推出“种子班”模式,强调“以任务聚人、以实战育人”。该模式以具体模型训练为目标,汇聚不同地区、不同专业背景的青年人才,形成高频讨论、快速试错的工作机制。学员在保留原单位岗位的同时脱产投入攻关,获得科研支持与生活保障,减少非科研事务干扰。跨界成员通过实践快速掌握数据处理、训练调参、部署适配等全流程,实现能力提升。 影响:围绕百亿级基因组基础模型Genos的研发,团队分组协作覆盖数据、模型、应用等环节,形成完整闭环,提升问题定位与修复效率。目前,Genos已发布1.2B和10B版本,并针对真实场景优化推理性能与国产硬件适配。未来将通过引入更多高质量数据持续改进模型。“种子班”将人才培养与科技前沿需求结合,为生命科学计算、医学研究等领域储备可持续人才。 对策:“种子班”的经验可总结为三点:一是任务清单化,明确目标与评测体系;二是能力模块化,通过关键岗位协同构建科研与工程并重的团队;三是合作制度化,借助高校与企业反馈优化应用需求与算力支持。此外,还需完善数据合规、知识产权等规则,推动科研成果向产业应用转化。 前景:浙江正构建平台、高校、企业协同的创新生态,为基础模型研发提供成熟环境。随着联合实验室建设与成果转化机制完善,“种子班”模式有望扩展到更多领域,促进跨学科创新。基因组基础模型若能持续突破性能与效率瓶颈,并与医疗健康、生物制造等场景深度结合,将提升我国在生命科学与智能计算交叉领域的竞争力。
浙江的经验证明,创新需要制度、生态与开放的共同作用。“种子班”模式正是这个理念的实践——聚焦真问题、鼓励探索、宽容失败。当人才与机遇相遇,这片创新热土正以乘法效应回报每一位奋斗者,也为中国科技自立自强注入浙江智慧。