染色体|首个完整无间隙人类基因组序列出炉( 三 )


而更准确的5条染色体臂图谱的呈现 , 或帮助科学家开辟新的研究方向 , 有助于回答有关染色体如何正确分离和分裂的基本生物学问题 。
“生成真正完整的人类基因组序列代表了一项令人难以置信的科学成就 , 提供了人类基因蓝图的第一个全面视图 。 ”格林说 , “这些基础信息将推进许多正在进行的努力 , 帮助我们了解人类基因组的细节 , 这反过来又将为人类疾病的基因研究提供支持 。 ”
除了完成组装拼图的医学研究意义之外 , 它还有助于回答:我们的基因组中包含什么使我们成为了人类?与其他猿类相比 , 原始基因组中的一些空白基因现在被认为对于帮助人类制造更大的大脑至关重要 。 着丝粒的变异性也可能为人类祖先如何进化提供新证据 。
现在 , 科学家能够随时间变化跟踪这些新的基因组区域 , 从而能够对一代又一代、不同起源的人或物种进行更严格的比较 。
例如 , 艾希勒实验室的研究生哈维·吉塔特对与人类前额叶皮质扩张相关的基因家族TBC1D3的分析显示 , 在灵长类动物进化的不同点上发生了反复和独立的扩张 。 最近一次发生在约200万到260万年前 , 大概是人属出现的时候 。 令人惊讶的是 , 人类的TBC1D3基因家族在一部分样本中显示出显著的大规模结构变异 。
【染色体|首个完整无间隙人类基因组序列出炉】研究人员在其论文中解释说 , 不同的人有着截然不同的TBC1D3基因家族的互补和排列方式 。 对于一个被认为对大脑功能如此重要的基因来说 , 这是令人意想不到的 。 科学家们还发现了LPA基因复杂结构的多样性 , 这种脂蛋白基因部分的变异性是血液中血脂水平异常导致心血管疾病的最重要的遗传风险因素 。
研究人员还研究了SMN基因(一种运动神经元基因) , 其突变与某些神经肌肉疾病有关 。 对脊髓性肌萎缩区域(5号染色体上最难完成测序的区域之一)进行更好的序列识别 , 从而有助于确定疾病风险并进一步治疗 , 因为重复基因SMN2是最有效基因疗法之一的靶点 。
此外 , 许多疾病与着丝粒中的结构重复有关 , 因此 , 新序列有助于科学家研究与基因相关的疾病 。
众所周知 , 着丝粒在细胞繁殖时在DNA复制中发挥作用 , 如果显著改变它们在染色体中的位置 , 就可以产生全新的物种 。 当某些异染色质着丝粒基因过度表达时 , 癌细胞会疯狂分裂;细胞分裂和细胞之间遗传物质分配出错也可能导致产前发育的异常 , 如唐氏综合症或罗伯逊易位 , 而对着丝粒基因组的全面了解可能为治疗这些疾病打开新大门 。
基于这些和其他发现 , 科学家们指出 , 新的参考基因组“揭示了对神经发育和人类疾病很重要的基因中人类遗传变异的前所未有的水平” 。
这不是结束而是新的开始
此次 , T2T团队使用的葡萄胎细胞只保留了XX染色体——一组重复的染色体 , 缺失了Y染色体 。 而完成单倍体基因组测序并不是“人类基因组计划”的最终目标和结果 , 更是一个新的开始 。
艾希勒称:“我们已经完成了一个基因组 。 在接下来的几年里 , 将会有数百甚至数千个基因组 。 我认为我们对人类彼此不同的看法将发生转变 , 更复杂的遗传变异不仅对了解什么使我们成为人类很重要 , 而且对了解什么使我们与众不同也很重要 。 ”
下一阶段 , 科学家们将对多个不同个体的基因组进行测序 , 以充分掌握人类的多样性、疾病以及人类与其他灵长类动物的关系 。
好消息是 , 研究人员也即将发布来自不同来源细胞的Y染色体的完整序列 。 对这一新Y染色体序列的分析将出现在未来的出版物中 。