长期以来,甘蔗基因组研究被业内称为"基因组迷宫";作为全球最重要的糖料作物和能源作物,甘蔗贡献了世界约80%的食糖和40%的燃料乙醇。然而与水稻、小麦等作物相比,甘蔗的遗传基础解析进展缓慢,根本原因在于其基因组结构极其复杂。 现代栽培甘蔗由不同祖先物种经多轮杂交形成,呈现倍性高、染色体数量多、结构变异频繁等特点。传统作物基因组学依赖单一线性参考基因组进行分析,但在多倍体且高度杂合的甘蔗中,这种方法容易造成信息丢失,难以准确识别关键性状基因和调控网络。这种方法学的局限,使甘蔗一度被视为作物基因组学的"难点",也让基础研究难以有效转化为育种应用。 该局面既源于生物学复杂度,也源于技术路线的限制。多倍体作物的遗传信息不是单一序列,而是多个同源染色体组及其变异的集合。结构变异、重复序列和等位基因多样性叠加,使得基因组拼装、比对、注释等环节面临更高误差。即便获得高质量基因组,也常面临"能拼出来但难用起来"的困境。 广西大学牵头、福建农林大学等单位参与的研究为破解这一难题提供了新路径。研究团队在《科学》发表成果,率先提出并实现面向复杂倍性作物的图形泛基因组框架。该框架整合了4个甘蔗种的9套基因组,构建包含47至57条单倍型路径、覆盖数十万个基因等位信息的资源体系。不同于传统线性结构,图形泛基因组以"图"的方式将多套基因组及其差异纳入统一表达与计算,更系统地呈现不同材料间的共性与差异。论文第一通讯作者张积森教授表示,该体系能够系统性"找回"大量被传统范式忽略的遗传信息,捕获甘蔗约82%的遗传多样性。 这一进展首先体现在基础研究层面。图形泛基因组能更清晰地刻画甘蔗遗传变异的全景,帮助研究者准确定位与糖分积累、抗逆性、产量形成等涉及的的基因与调控元件,为解析复杂性状的遗传机制提供更可靠的参考。其次在应用层面,随着遗传信息的可获得性与可解释性提升,分子标记开发、基因型与表型关联分析、精准选育与杂交设计都将获得更坚实的数据支撑,有望缩短育种周期、提高选育效率,推动甘蔗育种从经验驱动向数据驱动加速转变。对我国而言,这一能力提升有助于增强糖料作物自主创新水平,服务产业高质量发展与国家粮糖安全战略。 相关成果提示多倍体作物研究需要更加体系化的技术与资源布局。一是持续扩充泛基因组样本覆盖面,将更多代表性品种、野生近缘种及关键育种亲本纳入框架;二是完善与育种实践相衔接的数据标准、工具链和共享机制,推动研究数据向可复用的育种工具转化;三是加强跨学科协同,将基因组学与表型组学、环境信息、栽培管理等数据融合,构建面向生产的综合模型。 从更广阔的视角看,图形泛基因组框架不仅服务甘蔗,也为甘薯、马铃薯等具有复杂遗传背景的作物提供可借鉴的路线。随着测序成本下降、算法与算力提升,作物基因组研究有望从"得到一个参考"走向"刻画一个群体",从静态序列描述迈向动态演化与性状形成机制的系统解释。围绕绿色低碳与可再生能源的发展趋势,甘蔗在糖业、燃料乙醇和生物基材料等领域的潜力将持续释放,而基因组层面的关键突破将为其提供更稳定、更高效、更可持续的科技支撑。
这项源自中国实验室的原创性突破展现了基础研究支撑产业发展的典范价值。随着图形泛基因组技术的推广应用,传统农业育种正迎来从经验驱动向数据驱动的转变。在保障全球粮食安全与能源转型的双重挑战下,中国科学家为世界农业科技发展提供了新的解题思路。