DNA第三代测序技术的应用探究
DNA 第三代测序技术的应用探究
摘 要: 在自然界中,生物 DNA 的碱基序列包含着生物体中绝大多数的遗传信息,破
译这些碱基序列就成了探索生命奥秘的至关重要的课题。随着第二代测序技术(Next-Generation
Sequencing,NGS)的发展和应用,其弊端正在显现,而第三代单分子测序技术在一定程度上可
以弥补 NGS 技术在应用中的一些不足。本文阐述了第三代单分子测序技术的 2个测序原理,
介绍其在基因组、转录组、表观遗传学等方面的应用现状,同时对其未来发展进行展望。
Abstract: In nature, the base sequence of biological DNA contains most of the genetic
information in the organism, so how to decipher these base sequences becomes a crucial issue in
exploring the mysteries of life. With the development and application of Next Generation Sequencing
Technology (NGS), some of his drawbacks are emerging. The third-generation single-molecule
sequencing technology can make up for some shortcomings in the application of next-generation
sequencing technology to a certain extent. This article describes the two sequencing principles of the
third-generation single-molecule sequencing technology and introduces its application in the research
of genome, transcriptome, epigenetics, etc., and looks forward to its future development direction.
Keyword: The third generation sequencing technology; Principle; Biology; Application;
随着生物信息学的快速发展,DNA 测序技术在不断创新。第一代测序技术,即 Sanger 的链终
止方法[1]于1977 年登上历史舞台,其主要应用于人类基因组(HGP)计划,人们耗时 15 年花
费了 30 亿美元完成了首个人类基因组图谱。尽管一代测序读长可达 1 000 bp、精确度高达
99.999%,但测序通量低、成本高等缺点限制了它的大规模应用。直到 21 世纪初,以高通量为
主要特点的第二代测序技术(又称为下一代测序技术,Next-Generation Sequencing,NGS)的
开发,如 Roche 公司的 454 技术、Illumina 公司的 Solexa 技术和 ABI 公司的 SOLID 技术[2],使
成本从 HGP 的1亿美元 1个基因组下降到 2015 年底的 1 000 美元 1个基因组,并且测序时间大
幅缩短,成功地把 DNA 测序引入到了高通量测序时代,同时也把研究方向从单个基因位点扩
展到全基因组研究的水平层面,并从人类应用扩展到各种生物的研究中。然而由于第二代测序
技术存在读长过短、引入 PCR 扩增错误、具有 GC 偏好性等缺点,不能够完全满足人们对于全
基因组测序的需求。随着人们继续研究高通量测序技术,以单分子测序为技术特点的第三代测
——序He-licos 单分子测序仪、Pacific Bioscience 的SMRT 技术和 Oxford Nanopore Technologies
公司的纳米孔单分子测序技术登上了 DNA 测序技术的舞台。与第二代测序的核心原理,即边
合成边测序相比,第三代测序技术的特征在于单分子测序,即不需要 PCR 扩增,这就避免了
PCR 扩
1 、 第三代测序技术的方法及其原理
1.1 、Pacific Bioscience SMRT 技术
从测序手段来看,PacBio 测序是基于光信号的三代测序技术,PacBio 测序可在目标 DNA 分子
复制的过程中捕获序列信息(即边合成边测序)。PacBio 测序使用一种被称为 SMRTbell 的模
板,这是一个通过将发夹接头序列连接到目标双链 DNA 分子两端而形成的单链环状DNA 分
子。当SMRTbell 通过被称为 SMRT cell 的芯片上时,SMRTbell 会扩散到被称为零模式波导
(Zero-Mode Waveguide,ZMW)的测序单元中,每个SMRT cell 中含有 15 万个零模式波导
管。ZMW 是一种直径仅为几十纳米的纳米孔,每个ZMW 底部都固定有聚合酶,可以与
SMRTbell 的任一发夹接头序列结合并开始复制。SMRT cell 中添加有4种不同荧光基团的核苷
酸,不同荧光基团被激活时会产生不同的发射光谱。当一个碱基与聚合酶结合时,便会产生一
个光脉冲被记录下来,根据光的波长和峰值便能够识别这个碱基[3]。PacBio 测序的一个关键是
将反应信号与游离碱基的荧光背景区别出来,因为 ZMW 的孔径小于波长,从底部打上去的激
光不直接通过孔径,但是可以在孔径处发生光的衍射,仅仅能够照射 ZMW 的底部区域。而
DNA 聚合酶就锁定在底部的这个区域,只能被碱基携带的荧光团激活并检测到发光,从而大
大减少了背景荧光的干扰。PacBio 测序的另一个关键是聚合酶的活性,它决定了测序的长
度。DNA 聚合酶的活性会在激光照射下逐渐减弱,因此不能无限长度的进行合成反应,所以
DNA 链的测序长度是有限的。此外当存在如甲基化之类的碱基修饰时,相邻碱基的测序时间
会变长,因此可以通过测定相邻2个碱基的测序时间来检测碱基修饰。碱基携带的荧光基团可
以被激活并被检测到,从而减少背景荧光的干扰。PacBio 的测序速度很快,然而,这种测序方
法的错误率(可达到 15%)远高于二代测序,不过因为出错随机,可通过增加测序深度来有效
纠正测序错误。
1.2 、纳米孔单分子测序技术
与基于光信号的 PacBio 测序不同,纳米孔单分子测序技术(The Single-Molecule Nanopore DNA
Sequencing)的实质是利用电信号测序的技术,其原理是纳米孔内有共价结合的分子接头,当单
个碱基或DNA 分子通过纳米孔通道时,会使电荷发生变化,从而短暂地影响流过纳米孔的电
流强度。由于化学结构的差异,A、C、G和T这4种不同碱基通过纳米孔时会产生不同强度的
电流,通过灵敏的电子设备可以检测到电流变化,进而可以识别 DNA 链上的碱基完成测序。
与上述 PacBio 测序方法相比,纳米孔单分子测序技术处理样品非常简单,也不需要脱氧核糖
核苷酸,这也表明该测序方法的便宜性。然而,纳米孔单分子测序技术也有缺陷,由于 DNA
通过纳米孔极其迅速,极可能引起电流特征性变化不明显,从而降低测序的准确度,故将单个
核苷酸通过孔的速度降低则成为了这个技术拟解决的难题,与 PacBio 测序类似,纳米孔单分
子测序的碱基错误率也远高于二代测序。
2 、第三代测序技术的应用
2.1 、 在基因组方面的应用
2.1.1 、 从头组装
获得一个物种的基因组对相关研究者具有十分重要的意义,二代高通量测序的发展使得诸多物
种的基因组从头组装(De novo assembly)成为现实。然而由于许多生物学和技术上的原因,
特别是重复或杂合序列、测序错误、嵌合读码、读长不足或读码覆盖不全或有偏差等因素[4],
造成高质量的基因组组装具有很大挑战性。在这些限制因素中,最突出和最具挑战性的便是重
复序列,二代测序技术因为读长过短(只有50~500 bp)在鉴别重复元素等方面存在固有的局限
性。三代测序的长读长(10 kp 以上)克服了二代测序的这些限制,因此利用三代测序产生的长读
长进行从头组装成为三代测序的主要应用方面[3]。
2016 年,Shi 等[5]用单分子实时(SMRT)测序对中国人个体 HX1 进行测序,构建物理图谱,生
成2.93 Gb 的从头组装数据集,为中国个体生成了第一个近乎完整的从头组装基因组,该基因
组填补了人类参考基因组 GRCh38 中274 个(28.4%)空白,与 GRCh38 相比,发现了 12.8 Mb 的
HX1 特异性序列,包括在先前报道的亚洲人基因组中不存在的 4.1 Mb 序列。2018 年,Adam
Ameur 等[6]也使用 SMRT 测序对 2个瑞典人基因组进行了重新组装,研究发现每个个体中有超
过10 Mb 的序列从人类参考基因组 GRCh38 中缺失,而且大约有6 Mb 的新序列是与中国人的
个人基因组(HX1)共有的。这些研究结果表明了GRCh38 参考基因组还不完整,同时证明了
三代测序在复杂基因组的组装上具有独特的优势,能够发现诸多二代短读长测序遗漏的基因组
信息。
目前三代测序除了应用在人类基因组的从头组装上,也已经用在水稻[7]、小麦[8]、猪[9]、鸡
[10]、牛[11]、羊[12]等具有重大经济价值的动植物基因组的从头组装上。
2.1.2 、 结构变异检测
结构变异(Structural Variation,SV)包括拷贝数变异、插入、删除、易位以及这些事件的组合
等,SV 已被证明对许多物种的进化、基因组疾病、基因调控和其他表型等有重大影响[13]。与
单核苷酸多态性(SNPs)相比,SV 的情况复杂得多,因此更难以检测和识别。由于二代测序
长度较短,检测出的SV 具有低灵敏度和假阳性率高的特点,对这些复杂SV 的研究有很大的
局限性,尤其是涉及重复区域的结构变异研究。而三代测序产生的读长平均长度远大于二代测
序产生读长,大大有利于结构变异的检测。Couldrey 等[14]利用PacBio 长读长测序和 Illumina
测序检测和评估新西兰奶牛的拷贝数变化,研究表明这种长读长测序对于 CNV 的检测是一个
理想的平台,将最终有助于改进基因组预测。
摘要:
展开>>
收起<<
DNA第三代测序技术的应用探究 摘 要:在自然界中,生物DNA的碱基序列包含着生物体中绝大多数的遗传信息,破译这些碱基序列就成了探索生命奥秘的至关重要的课题。随着第二代测序技术(Next-GenerationSequencing,NGS)的发展和应用,其弊端正在显现,而第三代单分子测序技术在一定程度上可以弥补NGS技术在应用中的一些不足。本文阐述了第三代单分子测序技术的2个测序原理,介绍其在基因组、转录组、表观遗传学等方面的应用现状,同时对其未来发展进行展望。 Abstract:Innature,thebasesequenceofbiologicalDNAcontainsmostoft...
相关推荐
-
中华人民共和国气象法
2024-12-30 57 -
中国气象局关于修改《气象行政许可实施办法》的决定
2024-12-30 53 -
中国气象局关于修改《气象行政处罚办法》的决定
2024-12-30 96 -
中国气象局关于修改《防雷减灾管理办法》的决定
2024-12-30 163 -
中国气象局关于废止部分部门规章的决定
2024-12-30 45 -
通用航空飞行管制条例
2024-12-30 78 -
施放气球管理办法
2024-12-30 115 -
人工影响天气管理条例
2024-12-30 48 -
气象资料共享管理办法
2024-12-30 45 -
气象专用技术装备使用许可管理办法
2024-12-30 70
作者:闻远设计
分类:社科文学类资料
价格:免费
属性:5 页
大小:22.55KB
格式:DOCX
时间:2024-04-20

