基因测序技术概述
摘要:基因测序技术是一种发展迅速和应用广泛的现代分子生物学技术之一。本文基于国内外基因测序技术的发展现状,综合评述了四代基因测序技术,归纳了它们各自的特点与优缺点,以及应用现状、范围及其在实际应用中的优势和不足,总结了当前出现的基因测序新方法,并对该项技术的发展趋势进行展望。 关键词:基因测序技术;发展;应用;前景
Abstract: Gene sequencing technology is a kind of modern molecular biology techniques with rapid development and wide application .In this paper, it is based on the current development of gene sequencing technology at home and abroad, a
comprehensive review is given on the four generations of gene sequencing technology, it sums up their respective characteristics , advantages and disadvantages, as well as their application about status, scope and its advantages and disadvantages in practical application, it summarizes the new gene sequencing method, and points out the development trend of itself.
Key words: Gene sequencing technology; Development; Application; Prospects
1
基因测序技术,又称DNA测序技术,是分子生物学研究中最常用的技术,它的出现极大地推动了生物学的发展成熟。该技术始于20世纪70年代中期。1977
[1]
年Maxam和Gilbert报道了通过化学降解测定DNA序列的方法。同一时期,Sanger发明了双脱氧链终止法。20世纪90年代初出现的荧光自动测序技术将DNA 测序带入自动化测序的时代。这些技术统称为第一代基因测序技术。最近几年发展起来的第二代基因测序技术则使得DNA 测序进入了高通量、低成本的时代。目前,基于单分子读取技术的第三代测序技术已经出现,该技术测定DNA 序列更快,并有望进一步降低测序成本。[2]
第一代DNA测序技术包括传统的化学降解法、双脱氧链终止法、基于Sanger原理而发展的荧光自动测序技术,以及杂交测序技术等[3]。随着人类基因组计划的完成,进入功能基因组时代后,传统的第一代测序技术不足以满足深度测序和重复测序等的需求,因而促进了新一代测序技术的发展。第二代测序平台包括454测序技术、Solexa技术和SOLID测序技术。第三代测序技术是在第二代测序基础上增加读长,提高了测序效率,降低了成本。三代主要是单分子测序,能直接对RNA和甲基化DNA序列进行测序[4]。第四代测序技术为纳米孔测序技术,具有长读长、高通量、低成本和短耗时的优势 [5]。目前,四代测序技术在各项研究领域中均有所应用,未来测序技术将会发挥更大的作用。 1国内外基因测序技术 1.1第一代测序技术 1.1.1化学降解法
1977年,Gilbert等提出了化学降解法。在该方法中,一个末端被放射性标记的DNA片段在五组相互独立的化学反应中分别被部分降解,其中每一组反应特定地针对某种碱基。因此生成五个特异性标记的分子,每组混合物中均含有长短不一的DNA分子,长度取决于该组反应所针对的碱基在原DNA片段的位置。最后,各组混合物通过聚丙烯酰胺凝胶电泳进行分离,再通过放射自显影来检测末端标记的分子。[6]
化学降解法刚提出时,因准确性及易掌握性使用比较广泛。而且化学降解法有一个独特的优点即用原DNA分子进行测序而不是酶促合成产生的拷贝,排除了合成时造成的错误。但由于操作复杂,之后被Sanger法所代替。 1.1.2双脱氧链终止法
双脱氧链终止法又称Sanger法,该方法的原理是:由于双脱氧核苷三磷酸(ddNTP)的2'和3'都不含羟基,在DNA反应中不能合成磷酸二酯键,因此可以被用来中断DNA合成反应。[7]核酸模板在DNA聚合酶、引物、四种单脱氧核苷三磷酸(dNTP,其中的一种用放射性P32标记)存在条件下复制时,在四管反应系统中,分别按比例引入四种ddNTP,因为双脱氧核苷没有3'-OH,所以只要双脱氧核苷渗入链的末端,该链就停止延长,若链端掺入单脱氧核苷,链就可以继续延长。如此每管反应体系中便合成以各自的双脱氧碱基为3'端的一系列长度不等的核酸片段。反应终止后,分四个泳道进行凝胶电泳,分离长短不一的核酸片段,长度相邻的片段相差一个碱基。经过放射自显影后,根据片段3'端的双脱氧核苷,便可依次阅读合成片段的碱基排列顺序(图1A)。
Sanger法因操作简便,得到广泛的应用。后来在此基础上发展出多种DNA测序技术,其中最重要的是荧光自动测序技术。 1.1.3毛细管电泳和荧光测序
荧光自动测序技术基于Sanger原理,用荧光标记代替同位素标记,并用成像
2
系统自动检测,从而大大提高了DNA测序的速度和准确性。在1990年,毛细管凝胶电泳-质谱测序技术被Zagursky和McCornick建立。毛细管凝胶电泳技术将凝胶电泳对大分子的高分辨率与毛细管电泳的快速微量相结合。电泳中凝胶的抗对流性大大提高了分辨率。目前,应用最广泛的美国应用生物系统 (Applied Biosystems, ABI) 公司的3730系列自动测序仪即是基于毛细管电泳和荧光标记技术的 DNA测序仪。 [8,9] 1.1.4杂交测序技术
杂交测序是20世纪80年代末出现的一种测序方法,该方法不同于化学降解法和Sanger法,而是利用DNA杂交原理,将一系列已知序列的单链寡核苷酸片段固定在基片上,把待测的DNA样品片段变性后与其杂交,根据杂交情况排列出样品的序列信息。杂交测序检测速度快,采用标准化的高密度寡核苷酸芯片能够大幅度降低检测的成本,具有部分第二代测序技术的特点。但该方法误差较大,且不能重复测定。
第一代测序法准确率高和读长长,适合对新物种进行基因组长距离的框架构建及测序长度KB-MB级别的小规模项目;可用于已知或未知的基因突变检测,常被用作标准的鉴定方法以及最终确定突变的确切位点与突变性质的手段;该法特
[10]
别适用于单基因病的基因诊断和产前诊断。但其通量小,只能逐段测序即只能分析单个的 DNA 片段,无法完成全基因组层面的分析,且测序成本高,数据分析量大,自动化程度不高或需手工操作。
第一代测序技术,不管是Sanger的双脱氧链终止法还是 Maxam 和 Gilbert 的化学裂解法,都需要放射性同位素标记,操作繁琐且不能自动化,故无法满足大规模测序的要求。另外,毛细管微阵列DNA 测序在成本与耗时方面亦无法满足基因组学的发展需要。[11,12] 1.2第二代测序技术
高通量测序技术,又名二代测序或深度测序,可以一次性测定几十万甚至几百万条序列,是传统测序技术的一次革命,主要有454测序平台和Solexa测序平台。高通量测序技术属于一类循环阵列合成测序的技术群。这类技术首先都是将基因组DNA随机片段化并制备文库,通过对数以万计克隆阵列的延伸反应产生信号的检测,最终获取测序的信息。该技术有两个方面的突出优势:其一,通过使用微阵列配置实现大规模的并行化测序,提高测序效率;其二,无需电泳分离过程和细菌转染、质粒制备等克隆过程,设备趋于微型化,从而降低了各环节的成本,节省了时间和人力。该技术的发展使人类对各种病原或物种遗传多样性的评价达到了前所未有的详细程度,它已成为现代科研中必不可少的技术之一。
第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子进行序列测序,方便了对一个物种的转录组测序或基因组深度测序。[13]高通量测序技术进入市场,使DNA测序技术在2005年发生了重要转折,改变了测序的规模化进程。瑞士罗氏(Roche)公司和美国应用生物系统(Applied Biosystems, ABI)公司都推出了各自的新一代DNA测序仪,主要技术革新有以下几点:采用矩阵分析技术,实现了大规模并行化,使得矩阵上的DNA样本可以被同时并行分析:不再采用电泳技术,使得DNA测序仪得以微型化,测序成本大大降低;边合成边测序,测序速度大幅提高(图1B)。[14] 1.3第三代测序技术
第三代测序技术是高通量、单分子测序,单分子测序仪被应用于第三代的测序(图1C)。太平洋生物科学(Pacific Biosciences)公司的单分子实时测序(SMRT)
3