中国农科院作科所推出基因组预测新模型:明显提高复杂性状预测精度与算效

(问题)基因组预测是现代分子育种的关键环节,通过作物基因型信息对产量、品质、抗逆等表型进行提前评估,可压缩育种周期并降低田间鉴定成本;但实际应用中,基因组数据维度高、序列长,复杂性状又受多基因微效应和环境互作共同影响,预测模型既要覆盖全面信息,又要准确抓住关键点。不少统计或传统建模方法在大规模数据下存在算力消耗大、难以刻画远距离遗传关联、解释性不足等问题,限制了基因组预测在更广泛育种场景中的应用。 (原因)业内普遍认为,复杂性状常呈现“弱信号多、噪声强”的特点:关键遗传位点贡献不均衡,基因间的长距离互作与连锁效应也难被简单线性假设捕捉。当模型既无法突出关键信息,又难以有效处理超长序列时,预测准确率与训练效率往往难以同时保证,进而影响育种决策的可靠性和推广成本。 (影响)针对上述难题,中国农业科学院作物科学研究所大豆育种技术创新与新品种选育创新团队于3月26日发布研究进展:团队研发的GP-WAITER模型在思路上进行了改进,将全基因组关联分析获得的变异位点以权重形式融入编码环节,使模型训练更聚焦与性状有关的遗传信息,同时兼顾局部特征提取与长距离依赖关系刻画,从而更高效地处理超长基因组序列。研究显示,该模型在大豆、玉米等6类数据集中,与7种主流模型相比预测准确率平均提升27.2%,最高提升达77.5%;计算效率提高1.8至2.4倍,并降低显存占用。团队还通过可解释性分析深入挖掘出影响大豆油脂及异黄酮含量的关键基因,为后续功能验证与定向改良提供了候选靶标。 (对策)业内专家指出,要让基因组预测从“可用”走向“好用”,需要同时提升算法性能、加强可解释性,并与育种流程更紧密衔接。本项研究的启示在于,将生物学先验信息与数据驱动方法结合,有助于增强模型对关键遗传信号的识别能力,降低“黑箱”风险,并减少算力门槛。下一步可在不同作物、不同生态区开展更大规模验证,提升模型在多环境、多性状联合预测中的稳定性;同时加强与田间表型和环境因子数据的融合,提高对复杂育种目标的综合评估能力,推动研究成果更快转化为可操作的育种决策工具。 (前景)随着生物育种与信息技术加速融合,基因组预测将由单一性状预测逐步走向多性状协同、跨群体迁移与全流程智能化应用。GP-WAITER模型在准确率、效率与解释性上的进展,为构建更高效的分子设计育种体系提供了新思路。该成果已发表于《自然·通讯(Nature Communications)》。论文共同第一作者为作科所副研究员李静、作科所硕士研究生余林峰和环发所硕士研究生李梦凡;共同通讯作者为作科所孙君明研究员、邱丽娟研究员和李静副研究员。研究得到国家生物育种重大专项、国家自然科学基金和创新工程项目资助。

在全球粮食安全形势更趋复杂的背景下,基因组预测精度的提升不仅表明了农业科研能力的进步,也为粮食安全提供了重要技术支撑。这项成果表明,持续加强基础研究与核心技术攻关,才能在关键农业技术领域实现能力跃升,为端牢“中国饭碗”提供更有力的科技支撑。