基因测序技术发展及生物医学应用 | ![]() |
2. 齐鲁工业大学 校医院, 山东 济南 250353;
3. 山东省妇产医院, 山东 济南 250014
2. School Hospital, Qilu University of Technology, Jinan 250353, China;
3. Shandong Maternity Hospital, Jinan 250014, China
基因组携带了个体的全部遗传信息,基因测序能够加深对疾病尤其是恶性肿瘤的分子机制理解,在诊断与治疗方面都发挥着重要作用。人类基因组学计划完成后,基因测序技术的发展更加迅猛,在临床实践和基础研究中的应用更加广泛。化学裂解法是基于PCR的DNA测序法[1],可以对未知基因进行检测,但是不能读取长的PCR产物片段,所以很快被Sanger的双脱氧链末端终止法取代,此为第一代基因检测技术。以高通量为特点的下一代基因测序技术(Next Generation Sequencing, NGS)包括大规模平行签名测序(Massively Parallel Sequencing,MPS)、聚合酶克隆测序(Polony Sequencing)和连接测序(Sequencing-by-Ligation)等,此为第二代检测技术,是目前应用最为普遍的测序技术。目前第三代测序技术单分子实时测序已经成熟,而以纳米孔为基础的第四代测序技术也已崭露头角。本文简要概括了四代基因测序技术的发展特点及其生物医学应用。
1 第一代基因测序技术MAXAM和GILBERT[1]发明的化学裂解法,其基本原理是特定化学试剂可对碱基进行特异性修饰,在修饰碱基处(5’或3’)打断磷酸二酯键将一个DNA片段的5’端磷酸基做放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基,从而产生一系列长度不一而5’端被标记的DNA片段,这些以特定碱基结尾的片段通过凝胶电泳分离,再经放射自显影,确定各片段末端碱基,从而得出目的DNA序列。该方法能够检测双链DNA,但是其操作繁琐,程序复杂,被同时期的Sanger双脱氧链终止法取代[2]。
双脱氧链末端终止法测序是1977年由SANGER提出,其原理是将2’,3’-双脱氧核苷酸(ddNTP)参入到新合成的DNA链中,由于参入的ddNTP缺乏3’-羟基,因此不能与下一位核苷酸反应形成磷酸二酯键,DNA合成反应将终止。测序时分成四个反应,每个反应中加入DNA聚合酶、待测模板、引物、四种脱氧核糖三磷酸(dNTPs),除此之外还要加入一种双脱氧核苷三磷酸(ddNTPs),然后进行反应,ddNTPs随机取代相应的dNTPs,由于其3位的羟基变成了氢,不能继续延伸,使正在延伸的寡聚核苷酸选择性的在A、T、C或G处终止。终止的核苷酸由相应的ddNTPs决定,通过电泳可分离出长度不同的片段,再对这些片段的末端碱基进行检测从而获得所测片段的碱基序列。最初对凝胶片段末端碱基的检测是用同位素标记法,20世纪80年代,用荧光进行标记,可自动测序,到20世纪90年代,随着毛细管电泳技术以及微阵列毛细管电泳技术的发展,测序的通量得到大幅度提高。
双脱氧链末端终止法的优点有:
1) 可用于未知或已知突变的检测,更容易实行;
2) 假条带的出现减少,结果更加清楚;
3) 读取的长度也较长;
4) 因为掺入了同位素标记的三磷酸,末端终止法可以测更小序列的核苷酸链;
5) 基本适用于所有的突变类型,准确率几乎100%,在单基因病的基因诊断和产前诊断中仍广泛使用。
双脱氧末端终止法的缺点:
1) 离不开PCR扩增,且只能分析单个的DNA片段,通量小,不能进行基因组层面的分析;
2) 自动化程度低,检测速度慢,对于某些需要快速检测的疾病不适合;
3) 双脱氧链末端终止法成本高,不适用于大规模测序。
在过去的几十年,第一代测序技术一直作为基因诊断的标准,在基因病特别是单基因病症病人和各种遗传性酶病如苯丙酮尿症、自毁容貌综合症等其他疾病的诊断上发挥着举足轻重的作用,是最常用的基因测序技术[3]。
2 第二代测序技术(NGS)尽管SANGER的双脱氧链末端终止法已经提高了DNA测序的速度,但是在费用和效率上仍有不足,高通量、成本低的下一代测序技术(Next generation Sequencing,NGS)诞生了。大多数的NGS都是通过合成进行测序,每个目标NDA片段绑定到一个芯片上,然后加入被标记的核苷酸,在NDA聚合酶的作用下延长,高分辨率的摄像头捕获并整合每个核苷酸信号,标出空间坐标和时间坐标,每个位点的DNA序列通过计算机推断出来[4]。在NGS中,具有许多测序平台,如,454焦磷酸测序(454 Pyrosequenceing, ), 能够进行较长长度的准确读取[5],Illumina(Solexa)合成测序是运用最为广泛的NGS[6],测序的技术原理是采用可逆染料标记终止核苷酸边合成边进行测序反应,与454焦磷酸主要不同在于,连接寡核苷酸的流通槽代替了含有微珠的芯片以及终止末端使用的是染料而不是焦磷酸。SOLiD测序技术第一次出现是在2007年,SOLiD也要经过乳液PCR,这与454焦磷酸相同,它的独特之处在于以四色荧光标记寡核苷酸的连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序。
NGS还包括其他方法,像大规模平行签名测序(Msssively Parallel Signature Sequencing, MPSS), 聚合酶克隆测序(Polony Sequencing), 所有这些第二代基因测序技术都有一个共同点,测序反应进行的同时可以收集反应信号。与第一代测序技术相比,NGS的优势非常明显:
1) 高通量,高准确性,高灵敏度;
2) 自动化程度高;
3) 成本低;
4) 可用于未知物种,未知基因的检测。
NGS的应用十分广泛,在基因组学、转录组学,表达组学方面都有重要作用,在临床上主要有三个方面的应用:
1) 通过检测基因突变对肿瘤进行诊断,例如:在对纤维板层肝细胞癌(FL-HCC)进行RNA测序时发现一个嵌合转录,正常肝没有,通过全基因组测序得知,这个嵌合转录是19号染色体400个碱基缺失造成的,对病人的检测表明,与肝癌的发病机制有关[7]。结合全基因组扩增技术,SALVIANTI等人[8-9]探究了NGS对单细胞的分子特征进行检测的可行性。他们采用了乳腺癌细胞株,成功地对其中5个细胞进行了测序,在18个基因中发现了27个变异,但是,单细胞水平的基因诊断成为新的医疗方法还需要不断的探究优化。
2) 建立合适的靶向治疗。在一个检测肺癌突变基因的测序试验中, FENG等人[10]利用靶向测序对来自45个肺癌患者标本的737个基因位点进行基因突变的鉴定,发现突变经常发生在EGFR, KRAS, PIK3CK和TP53这些基因中,并且,在部分样本中,在这些关键基因中会有两个或三个突变。不同类型的肺癌对应不同的基因突变,靶向测序可以识别这些突变,可对进行个体化肿瘤测序以及靶向治疗进行指导。在非小细胞肺癌中,抗EGFR(表皮生长因子)靶向治疗经常涉及单点突变,但在恶性胶质瘤中,抗EGFR靶向治疗是由复杂的表观遗传学调控。NGS特发性耐药机制的应用似乎比单基因检测更为容易[11-12]。
3) 靶向测序技术(Targeted Sequencing)在未知病因的疾病诊断方面开启了新的一面,尤其在产前诊断中具有重大意义。传统的产前筛查都是利用羊膜穿刺术,具有很大的流产风险,现在胎儿染色体异常可利用无创产前筛查(Non-Invasive Prenatal Screening NIPS)手段进行检测,母体血清中含有与胎儿染色体异常相关的游离DNA(cell-free DNA, cfDNA)[13-14],在对孕妇进行NIPS基因测序后表明,基因测序与常规核染色体分析的结果比较一致[15]。在高危孕妇中,针对唐氏综合症和爱德华氏综合征的产前检测表明,大规模平行测序对细胞游离DNA测序的假阳性率远远低于传统产前筛查(0.3%vs.0.6%,唐氏综合症;0.2%vs.0.6%,爱德华氏综合征),阳性预测率也有显著差别(45.5%vs.4.2%, 唐氏综合症;40.0%vs.8.3%,爱德华氏综合征),DNA测序的结果要明显优于传统的产前筛查,而且只需要抽取母体的血液即可检查,方便快捷[16]。
3 第三代测序技术(单分子DNA测序)为了更好地发掘DNA信息,研究人员开发了新一代测序方法,单分子测序技术,即第三代基因测序技术,包括Heliscope测序技术,SMRT(Single Molecule Real Time, 单分子实时测序)离子半导体测序技术(Ion Torrent)等技术。较为成熟的是SMRT测序技术。
SMRT测序技术的原理:四种dNTP的γ-磷酸被不同荧光标记,被DNA聚合酶捕获,与模板链互补的碱基形成磷酸二酯键,荧光基团被聚合酶切掉,作用时间较长,荧光能够被激发检测到信号,而不能和模板匹配的碱基,停留的时间很短不能被检测。根据标记荧光基团光谱的不同来区分不同碱基,得出DNA序列。单分子荧光信号由零级波导技术(Zero Mode Waveguide, ZMW)检测[17],在一片附着在透明基质的金属薄膜上蚀刻出许多直径数十纳米的小孔,可以将激发光局限在这个小孔内,小于检测激光的波长,形成检测空间,DNA聚合酶就被固定在这个区域,只有在这个区域内碱基携带的荧光基团才能被激活检测,降低了背景荧光干扰。SMRT的荧光基团标记在核苷酸3’磷酸上,在DNA链延长的过程中被切去,减少DNA合成的空间位阻,而第二代的荧光基团都标记在5’端甲基上,随着DNA链的延伸会产生三维空间位阻,导致错读。
SMRT优点:
1) 超长读取;
2) 无需模板扩增;
3) 运行时间短,读取速度可达每秒10个碱基;
4) 能够直接检测表观修饰位点。
第三代基因测序技术可以直接检测RNA的序列,对唐氏综合症的检测有重大意义。个体大多数的发育过程都是由miRNA调控的,不同胎儿发育过程可由母体血浆细胞外的miRNA反射。1 043条miRNA,来自七例唐氏综合症妊娠孕妇和相同年龄相同胎儿性别的正常孕妇,通过高通量PCR检测发现,695条miRNA确定可被用作唐氏综合症产前诊断的生物标志物。虽然第二代基因检测技术已经能够对母体血浆内cfDNA进行分析,但是假阳性出现的概率仍然很大,结合miRNA的检测可提高确诊的准确性[18]。
4 第四代测序技术(纳米孔测序)DNA测序经历了三代的发展,现在进入到第四代——单分子纳米孔测序时代。自从1996年第一次有关纳米孔的报道出现后, 以纳米孔为基础的单分子测序技术迅速成为基因测序技术的热点[19]。纳米孔测序技术正朝着无需标记,长读取(104~106个碱基),高通量,少样本制备的方向发展,将会成为低成本快速进行基因检测的选择。牛津纳米孔公司(Oxford Nanopore Technologies)已经开发了小型的商业用途的迷你测序仪(图 1)。
![]() |
图 1 MinION纳米测序仪 |
用于DNA测序的纳米孔可大致分为两类:生物纳米孔和固态纳米孔。生物纳米孔,也称作跨膜蛋白通道。α-溶血素(α-HL)是第一种也是运用的最多的纳米孔,α-溶血素是金黄色球菌分泌的一种外毒素,是一个蘑菇状的七聚体跨膜通道,能够快速将自己插入到平面双成膜中,在最窄处形成一个1.4 nm宽的纳米通道,内直径与单链DNA的直径(约1.3 nm)相近,因此,单链DNA可以通过。而且,此纳米孔结构可以耐受将近100 ℃的高温和宽范围pH[20-21]。但是,α-溶血素的β-桶结构限制了它直接检测长链DNA分子。耻垢分枝杆菌孔蛋白A也是生物纳米孔的一种,但是最近的一项研究发现,本来关闭状态的含有MSCL(Mechanosensitive channel of large conductance)蛋白通道,在合适的电压范围内,会为单链DNA打开。含有MSCL的蛋白通道对四种核苷酸的膜张力不同,而且四种不同的核酸通过时会有不同的点电信号和机械信号,这提高了信噪比,并且DNA的转移速率比耻垢分枝蛋白A低了一个数量级,在DNA测序方面是一个很有吸引力的蛋白孔[22]。
由于微细加工技术的发展,固态纳米孔也逐渐得到关注,其在化学、热、机械稳定性、大小可调性和整合性方面都优于生物纳米孔。而且,固态纳米孔可以在多种实验条件下工作并且可以通过传统的半导体工艺大规模生产。常见的固态纳米孔有Si3N4、SiO2、Al2O3、BN、石墨单原子层、聚合物膜和其他混合材料,其中Si3N4和SiO2因为低机械应力和高化学稳定性应用最为广泛,他们可以通过互补金属氧化物半导体兼容的工业集成电路工艺来制造。有报道这两种纳米孔被用于检测DNA分子[23]。目前,固态纳米孔最大的一个缺点是不能分辨尺寸相近的分子,不过这点不足可以通过表面功能化修饰和附加特定的序列与受体来解决。
纳米孔测序技术可用于以下方面:
1) 检测单链DNA。CLARKE等人[24]研究表明,α-HL共价结合一个传感器分子通过测量电流能够连续的识别没有标记的单核苷酸(dAMP、dCMP、dGMP、dTMP)。
2) 检测双链DNA片段,噬菌体Phi29纳米孔最小直径为3.6 nm,允许单链DNA和双链DNA以及一些蛋白质分子通过。
3) 重复序列和Poly结构的测定。
4) 检测蛋白质。目前纳米孔的应用研究最多的是对DNA的检测,也可用于蛋白质的检测,因为蛋白质在大小、结构、电荷等性质方面比DNA多样化,检测也更困难。ACHARYA等人[25]通过纳米孔技术检测了折叠蛋白质的稳定性和单氨基酸突变造成的影响。
5) 在医学和临床上,特别是在癌症方面的研究起着引领作用。
5 总结与展望近十几年,基因测序技术迅猛发展。虽然第一代测序技术仍然活跃在各个检测平台,但第二代、第三代测序仪已相继问世,第四代测序技术也日趋完善。第一代到第四代测序技术都有优势与不足。
1) 第一代测序技术SANGER测序成本高、通量低、读长较长,有较高的准确率,对于较少样本测序仍是最佳选择。
2) 第二代测序技术已发展成熟,高通量、低成本的特点使其在大规模测序工作中广泛应用,但是测序读长相对较短是第二代测序技术的主要缺陷。
3) 第三代测序技术不仅提高了读长,而且可以直接检测RNA序列和甲基化序列。第三代测序技术仍然在不断开发中,其中Ion torrent测序技术前期文库制备过程繁琐,读长不足;SMRT测序技术的有效反应孔数目不足,原始测序数据准确率不高。
4) 第四代测序技术建立在第三代测序技术之上,与前三代技术相比较,代表性的纳米孔测序技术在成本和速度方面都得到大幅提升,仪器也更加小型化。
基因测序技术作为人类探索生命奥秘的重要手段之一, 对生命科学和生物医学等领域的发展起到了巨大的推动作用。尽管目前最为先进的纳米测序技术具有诸多进步,但仍面临很多挑战,例如DNA控制和纳米孔制造技术还处于实验室阶段。我们有理由相信,新一代测序技术的难点会逐渐克服,基因测序指导下的遗传病诊治、个性化精准医疗等能够更加高效的进行,未来基因测序技术必将对人类健康产生重大影响。
[1] |
MAXAMA M, GOLBERT W. A new method for sequencing NDA[J]. Proceedings of the National Academy of Sciences of the United States of America, 1977, 74(2): 560-564. DOI:10.1073/pnas.74.2.560 |
[2] |
SANGER F, NICKLEN S, COULSON A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences of the United States of America, 1977, 74(12): 5463-5467. DOI:10.1073/pnas.74.12.5463 |
[3] |
郭奕斌. 基因诊断中测序技术的应用及优缺点[J]. 遗传, 2014, 36(11): 1121-1130. |
[4] |
JEFFREY G, ELIEZER M, VAN A. Next-generation sequencing to guide cancer therapy[J]. Genome Medicine, 2015, 7(1): 80. DOI:10.1186/s13073-015-0203-x |
[5] |
MARGULIES M, EGHOL M, ALTMAN W E, et al. Genome sequencing in microfabricated high-density picolitre reactors[J]. Nature, 2005, 437(7057): 376-380. |
[6] |
HODKINSON B P, GRICE E A. Next-generation sequencing:a review of technologies and tools for wound microbiome research[J]. Advances Wound Care, 2015, 4(1): 50-58. DOI:10.1089/wound.2014.0542 |
[7] |
HONEYMAN J N, SIMON E P, ROBINE N, et al. Detection of a recurrent DNAJB1-PRKACA chimeric transcript in fibrolamellar hepatocellular carcinoma[J]. Science, 2014, 343(6174): 1010-1014. DOI:10.1126/science.1249484 |
[8] |
SALVIANTI F, ROTUNNO G, GALARDI F, et al. Feasibility of a workflow for the molecular characterization of single cells by next generation sequencing[J]. Biomolecular Detection and Quantification, 2015(5): 23-29. |
[9] |
SPEICHER M R. Single-cell analysis:toward the clinic[J]. Genome Medicine, 2013, 5(8): 74. DOI:10.1186/gm478 |
[10] |
FENG H, WANG X, ZHANG Z, et al. Identification of genetic mutations in human lung cancer by targeted sequencing[J]. Cancer Inform, 2015, 14: 83-93. |
[11] |
JANNE P A, YANG J C, KIM D W, et al. AZD9291 in EGFR inhibitor-resistant non-small-cell lung cancer[J]. The New England Journal of Medicine, 2015, 372(18): 1689-1699. DOI:10.1056/NEJMoa1411817 |
[12] |
NATHANSON D A, GINI B, MOTTAHEDEH J, et al. Targeted therapy resistance mediated by dynamic regulation of extrachromosomal mutant EGFR DNA[J]. Science, 2014, 343(6166): 72-76. |
[13] |
LO Y M, COBETTA N, CHAMBERIAIN P F, et al. Presence of fetal DNA in maternal plasma and serum[J]. The Lancet, 1997, 350(9076): 485-487. DOI:10.1016/S0140-6736(97)02174-0 |
[14] |
SPARKS A B, WANG E T, STRUBLE C A, et al. Selective analysis of cell-free DNA in maternal blood for evaluation of fetal trisomy[J]. Prenat Diagn, 2012, 32(1): 3-9. DOI:10.1002/pd.2922 |
[15] |
NEUFELD-KAISER W A, CHENG E Y, LIU Y J, et al. Positive predictive value of non-invasive prenatal screening for fetal chromosome disorders using cell-free DNA in maternal serum:independent clinical experience of a tertiary referral center[J]. BMC Medicine, 2015, 13(1): 1-11. DOI:10.1186/s12916-014-0241-z |
[16] |
BIANCHI D W, PARKER R L, WENTWORTH J, et al. DNA sequencing versus standard prenatal aneuploidy screening[J]. The New England Journal of Medicine, 2014, 370(9): 799-808. DOI:10.1056/NEJMoa1311037 |
[17] |
CHIN C S, ALEXANDER D H, MARKS P, et al. Nonhybyid, finished microbial genome assemblies from long-read SMRT sequencing data[J]. Nature Methods, 2013, 10(6): 563-569. DOI:10.1038/nmeth.2474 |
[18] |
WANG Y, ZHU J, CHEN Y, et al. Two cases of placental T21 mosaicism:challenging the detection limits of non-invasive prenatal testing[J]. Prenatal Diagnosis, 2013, 33(12): 1207-1210. DOI:10.1002/pd.4212 |
[19] |
KASIANOWICZ J J, BRANDIN E, BRANTON D, et al. Characterization of individual polynucleotide molecules using a membrane channel[J]. Proceedings of The National Academy of Science of The United States of America, 1996, 93(24): 13770-13773. DOI:10.1073/pnas.93.24.13770 |
[20] |
CHERF G M, LIEBERMAN K R, RASHID H, et al. Automated forward and reverse ratcheting of DNA in a nanopore at 5-A precision[J]. Nature Biotechnology, 2012, 30(4): 344-348. DOI:10.1038/nbt.2147 |
[21] |
KANG X F, GU L Q, CHELEY S, et al. Single protein pores containing molecular adapters at high temperatures[J]. Angewandte Chemie, 2005, 117(10): 1519-1522. DOI:10.1002/(ISSN)1521-3757 |
[22] |
FENG Y, ZHANG Y, YING C, et al. Nanopore-based fourth-generation DNA sequencing technology[J]. Genomics, Proteomics & Bio-informatic, 2015, 13(1): 4-16. |
[23] |
FARIMANI A B, HEIRANIAN M, ALURU N R. Electromechanical signatures for DNA sequencing through a mechnosensitive nanopore[J]. Physical Mhemistry Letters, 2015, 6(4): 650-657. |
[24] |
CLARKE J, WU H C, JAYASINQHE L, et al. Continuous base identification for single-molecule nanopore DNA sequencing[J]. Nature Nano-technology, 2009, 4(4): 265-270. DOI:10.1038/nnano.2009.12 |
[25] |
ACHARYA S, EDWARDS S, SCHMIDT J. Research highlights:nanopore protein detection and analysis[J]. Lab on a Chip, 2015, 15(17): 3424-3427. DOI:10.1039/C5LC90076J |