西湖大学团队提出联合组装新方法构建最大人类泛基因组揭示约13%未知序列

【问题】人类基因组计划完成二十余年来，全球科学界对遗传多样性的认识仍有明显缺口。传统研究长期依赖单一参考基因组，难以覆盖不同族群的特有序列，导致约5%至10%的临床基因检测结果存在不确定性。国际上的泛基因组项目也受到样本量偏小（通常不足百人）和测序成本较高的限制，难以全面呈现人类基因多样性。【原因】技术瓶颈仍是泛基因组研究推进缓慢的核心原因。第三代长读长测序可解析复杂基因组区域，但单样本成本高达数万元；短读长测序虽更经济，却难以准确组装重复序列和结构变异。西湖大学团队指出，现有分析方法对大规模样本的适配能力不足，不同测序平台的数据整合效率也偏低，更拉高了研究门槛。【对策】研究团队提出PIGA方法，将两条技术路径进行融合：先用中等深度短读长测序覆盖300人以上群体，再对关键区域开展针对性的长读长测序校准。通过“广覆盖+精准校准”的策略，单样本成本降至传统方案的1/5，同时二倍体分型精度提升40%。团队自主开发的算法还将不同族群的基因组数据统一到同一分析框架内，首次对汉族、藏族等东亚人群的特异序列进行系统标注。【影响】此次发布的泛基因组收录逾500个高质量单倍型。在新发现的13%未知序列中，包含与免疫调节、药物代谢有关的功能元件。临床验证显示，这些序列可帮助解释15种以往较难明确致病突变来源的遗传病。国家卫健委精准医学专项专家表示，该成果有望推动新生儿筛查、肿瘤靶向治疗等领域的相关标准更新。【前景】团队计划在三年内将样本量扩展至万人级，重点补足非洲、南美等代表性不足人群的数据空白。《自然》期刊同期评论认为，中国主导的此路径可能成为全球泛基因组研究的重要范式，其成本优势尤其适合发展中国家开展群体遗传学研究。科技部已将泛基因组技术纳入“十四五”生物医药重点攻关方向，未来有望带动新型基因诊断试剂和个性化治疗方案的研发与应用。

从单一参考到泛基因组，是基因组科学从“平均图景”走向“多样真实”的关键一步。更大规模、更低成本、更高质量的组装方法，不仅带来研究方法的更新，也将为医学诊断和健康管理提供更精细的遗传依据。随着技术和规范逐步完善，如何在开放共享与安全合规之间取得平衡，并让基础研究更快转化为公共健康收益，将成为下一阶段需要共同回答的问题。