国际团队突破基因组非编码区研究瓶颈 生命科学领域迎来重大技术革新

人类基因组由30亿个遗传字母组成,其中仅2%的编码区已被基本破译,而占98%的非编码区长期成为科学研究的瓶颈;这些非编码区虽不直接合成蛋白质,却掌控着基因的开启、剪接与表达,其变异是诸多疾病的根本诱因。 传统计算方法在破译非编码区时困难重重。一些模型只能读取短段DNA序列,容易遗漏远处的关键信息;另一些虽能处理长段序列但精度不足。更重要的是——现有模型多为"专科生"——各自只能解读特定功能,需要多个模型协同工作,效率低下。 AlphaGenome模型彻底改变了该局面。它能输入百万碱基长度的DNA序列,以单碱基分辨率预测RNA表达量、剪接结构、染色质可及性、转录因子结合位点及三维结构等近6000项调控特征。这意味着它既能处理超长DNA序列,又能捕捉单个碱基的细微变化,同时揭示这段DNA在细胞中的具体功能。 AlphaGenome的成功建立在既往创新的基础上。AlphaGo在2016年击败围棋世界冠军,AlphaFold在2020年破解了蛋白质折叠难题,这些成就为当前研究奠定了基础。项目团队专家程俊表示,自博士阶段就致力于遗传突变预测研究,曾主导AlphaMissense项目解读编码区,"剩下的98%一直是我们想要照亮的未知领域,这正是AlphaGenome诞生的初衷"。 在医学应用中,AlphaGenome已体现出显著潜力。在癌症研究中,它成功破解了T细胞急性淋巴细胞白血病的致病机制,能精准定位导致癌基因异常激活的非编码突变,阐明这些突变如何引发癌症。这使科学家能更快速地锁定癌症驱动突变,发现新的治疗靶点。 非编码区密码的破译将深刻改变医学诊断和治疗。许多长期查不出病因的疾病,其根源可能正是DNA非编码区的基因突变,AlphaGenome能精准识别这些"元凶",在罕见病和遗传病诊断中具有重大意义。通过阐明发病的基因机制,科学家可以开发更有效的药物,甚至为患者设计个性化治疗方案。从更深层次看,这一突破将加深人类对生命本质的理解,为后续生物医学创新奠定基础。

解读基因组的关键不在于把"字母"读出来,而在于把"调控语言"译出来。AlphaGenome为破解复杂生命调控密码提供了可行路径,但任何技术从实验室走向临床,都需要严格验证、规范应用与长期积累。我们需要持续夯实数据、方法与伦理治理的基础,才能让"看懂基因组"真正转化为守护健康的现实能力。