解读生命密码的基本手段—DNA测序技术的前世今生 2012-10-19 01:22:15      来源: 转自 科学网       责编: 管理员

导读

DNARNA序列被称之为生命密码是完全合情合理的,有效而准确地获取这些密码,成为生命科学研究的基本信息获得手段和赖以发展的根本基础。如今,解读这个密码的测序技术已经发展到令人惊讶的程度,但是其发展历程如何?本文进行了详细解读。

DNA(脱氧核糖核酸)和RNA(核糖核酸)是生命体的两种最基本组成物质,其序列的组成和变化造就了形形色色的生命世界。这两种承担了生命体遗传信息载体功能的物质,一方面在生命的不断繁衍中保持了各个物种的独特面目,另一方面又通过不断的演变改变着自身性状,同时又影响着与之相关的物种,这一规律在生命科学领域被归纳为中心法则。笼统而言,几乎全部的生命现象均来源于ATCG这四种碱基的排列顺序(在RNA序列中,U取代了DNA序列中的T)及其变化,并且,这种排列并非无序的随机组合,而是具有相当丰富的信息含量、生命内涵和变化规律性。所以,DNARNA序列被称之为生命密码是完全合情合理的,有效而准确地获取这些密码,成为生命科学研究的基本信息获得手段和赖以发展的根本基础。

DNA序列是如何测定的?

1975年英国生化学家Frederick Sanger发明了末端终止法DNA测序技术,打开了我们解读生命天书的大门,人们第一次真正看到了生命的最基本信息是什么样子,所谓的基因到底包含了哪些内容。随着了解的信息逐渐积累,量变产生了质变,我们得到了一些规律,而随之而来的却是更多的问题和困惑,研究工作愈加深入,我们就会发现自己的了解愈加贫乏。这就像战争催生技术革命一样,需求总是技术发展的源动力,从而日新月异的信息获取手段——测序技术——获得了长久不衰的发展,其过程就是序列获得原理发现了解深入疑问产生寻求答案更多的序列获得需求新技术产生更多序列的获得更深入的了解和更深入的疑问,正是这样周而复始的螺旋上升过程,推动了生命科学进入高速发展的轨道。

在这样的科学技术发展过程中,我们对序列获取的需求从最初的某一个基因的解析逐渐演化成对全部基因的解析、对基因组的解析、对转录组的解析、对DNA修饰的解析、对转录调控的解析、对RNA修饰的解析等等方方面面的需求和实践。应运而生的是自动化测序、高通量测序、RNA测序、甲基化测序等等技术变革甚至革命,其中最显著的就是测序设备通量的飞速发展,至今为止每天每台能够产生的测序数量已经从最初的几千个碱基(1985年)达到了2530G1G=109)个碱基,特别是近5年的进展,几乎可以用IT行业的摩尔定律来进行描述。可以说,目前对于最基本的DNARNA测序,除了价格因素外,基本可以满足科学研究的需要了。

既然说需求已经可以满足了,为什么还要发展测序技术呢?

能够测什么,还需要测什么?

经过几十年来的研究和积淀,人们对生命信息的理解从最初认识到的DNARNA,不断的进行丰富。在上个世纪80年代开始启动人类基因组计划之际,人们还在认为拿到人类的全部基因组序列就可以解读这部天书,但实际上这仅仅是一个开始,在这个当时比肩于阿波罗登月计划的项目进行中,我们就发现生命的信息远远超出当时的认知范围。占基因组多达1%的多态性位点、基因组中的非编码序列、种类繁多的各类不同功能的RNA、不同基因序列上的甲基化位点、DNA和蛋白相互作用的调控机制等等,诸如此类庞杂的信息以及深深隐遁其中的生命规律远不是测定一个基因组就可以解决的问题。

为了发现多态性位点和性状表现之间的关系,需要对大量样本进行重测序,才能从中总结规律;为了发现不同基因的不同甲基化程度,需要进行甲基化测序(通过亚硫酸氢钠处理DNA,使非甲基化的C变成U,测得序列中的C就是甲基化位点);为了发现不同组织中基因的转录水平,需要进行转录组测序(mRNA逆转录成cDNA,再进行测序)。从表面上看我们已经找到了应对各种需要的测序技术,实际上却不尽然。

对于DNA测序而言,目前的高通量测序技术在满足通量的同时,由于技术本身的限制,读取的单一序列长度一般介于75100个碱基(Life Technologies公司的5500xL SOLiD测序仪和Illumina公司的HiSeq2000测序仪),Roche公司的454 GS FLX测序仪可以达到500碱基的读长,相应的其通量仅仅为0.5G碱基,通量价格比远低于前两者(通量分别为180G200G)。这样就形成了一个瓶颈,通量高的读长短,读长长的通量低。

为什么我们要追求通量和读长?通量高可以让我们用更少的时间和更低的价格获得更多的数据;而读长则决定了对获得的序列片段进行拼接的难度。对于人类基因组重测序这样的工作,因为我们已经有了绝大部分都一致的参考序列,短读长片段可以很容易的通过比对找到相应的位置,但对于一个从来没有测过序列的物种,只能通过片段之间的相同序列来排定顺序,短读长就力不从心了。虽然我们开发了无数算法和软件来进行这项工作,但读长的局限性依然很大程度上存在。

另外,由于基因组中还存在有大量的特殊结构,比如重复序列,这种序列可能延续很长,造成我们只能得到这个片段两端的序列和不精确的中间距离,因为读长的限制,没办法发现中间的内容,就像是一条100公里的高速公路,而我们手中只有能跑20公里的汽车,我们就没办法发现这条路中间位置是否有美丽的风景。所以我们需要能够突破现有读长的技术出现(即使是传统的毛细管测序仪,读长最大也只能达到900个碱基)。

目前的测序技术还有一个相当大的问题,就是现有测序反应的模板都是通过对原始样品的核酸进行扩增后的产物,特别是对于RNA还需要先进行一步逆转录反应。我们知道首先扩增反应不可避免的会产生扩增的偏向性,例如在原始样品中的两个片段,一个有1000个拷贝,另一个只有10个拷贝,在扩增过程中并不会按照这个比例同步反应,很可能在扩增后拷贝多的片段变成了10万个,而少的变成100个,这样一部分片段就被自然的湮没了,造成的后果就是我们丢失掉了这部分信息,而恰恰这部分信息可能才是某个机制的决定性因素,举一个典型的例子,肿瘤发生的早期就是几个细胞的基因发生突变,而在基因扩增过程中这样微弱的变化就会被掩盖在占绝对优势的正常基因中。同时,这种技术还造成了另外一个问题,就是我们最终都是对扩增后的人工产物进行测序,而对于原始序列中存在的诸如修饰之类的信息也在扩增过程中被抹杀掉了。

由此可见,目前的测序技术一定程度上满足了现阶段研究的需要,但随着研究的深入和研究对象的复杂性提高,会有更多的需求被提出,如前文所述,新的技术需要应运而生了。

何为第三代测序技术?

从前文中可以发现,为了实现更深入的研究,技术的变革已经逐渐浮出水面了。首先需要回顾一下此前的技术发展历程,也就是说为什么有所谓下一代测序技术和第三代测序技术之分。

测序技术发明之初是通过在聚合酶、DNA模板、引物、dNTPddNTP的作用下发生延伸反应,因为ddNTP的存在,形成长度不等的延伸片段,根据不同碱基的末端终止片段长度,可以按顺序读出相应的序列。其后在此技术原理的基础上产生了几次变革,包括用四色荧光取代了放射性同位素标记和用毛细管电泳取代了平板凝胶电泳等。这一代测序技术统治市场多达30年之久,其中最出色的产品是ABi公司的3730xL测序仪,可以在23个小时内进行96个测序反应,读长最多可达900个碱基。因为这一代技术是对测序模板分别单独进行反应,通量已经达到了极限,而且单价远高于后来推出的高通量测序技术,因此在2005年后,基本上除了病毒外的基因组测序工作均已不再适用。但是这种技术可以对相对少量的特定位点、克隆产物和PCR产物的序列进行测定,仍然具有其细分市场定位。

2005年对于测序技术而言是一个转折点,因为在这一年高通量测序技术进入了市场,彻底改变了测序的规模化进程。RocheIlluminaABi都推出了各自的新一代测序仪,因为在当时的背景下,高通量测序技术属于一个突破性的进展,业界并未预料到其后续发展的速度之快,所以笼统的将之称为下一代测序技术,直到2009年更新的技术展示在世人面前的时候,大家才回想起来当时的短见,所以又有了下下代测序技术之说。我们在这里将2005年出现的下一代测序技术称为第二代测序技术,而此前的特定克隆测序则称为第一代测序技术。

第二代测序技术的技术特征是不再区分单一模板,而是将模板变成了,里面包括了我们希望测序的所有模板,同样是根据模板序列合成或者杂交形成互补链,通过互补链的延伸过程中引入的荧光标记来识别每个碱基。当然,这次是同时识别数百万个平行进行的测序反应了。因为这一代技术还都是通过荧光来进行识别检测,受限于光学检测灵敏度,测序模板实际上还是扩增产物,而另一个技术标志就是单分子的原始模板在固相(微球或芯片表面)上进行扩增反应,这却恰恰是第二代测序技术中最容易产生人为干扰的部分,因为操作水平的不同,这一代测序仪在不同的实验室性能表现参差不齐。

第二代测序技术的产生极大的推进了相关研究的进展和突破,让以前遥不可及的基因组测序工作简单到一个实验室都可以进行,但是,虽然满足了现阶段大部分工作需要,可是其技术瓶颈是难以克服的,尤其是模板扩增和序列读长,成为最集中的矛盾所在。这样就对测序技术提出了不经过扩增的单分子测序、读长超过以往技术和通量需要达到一定的规模等新的挑战。

正如下下代测序技术的称谓一样,技术的变革出乎所有人的意料。随着物理、化学、材料等学科的不断发展及其与生命科学的不断融合,在某种程度上可以解决更新一代测序技术的技术难题,这就催化了第三代测序技术的产生。相应的,第三代测序技术的技术标志就是单分子测序和长读长。目前上市或者即将面世的第三代测序仪仅有Helicos公司和Pacific Biosciences公司两款产品,Helicos公司的Heliscope是最先上市的单分子测序仪,但因为当时其采取的技术策略具有的局限性(通过聚合酶进行单分子聚合延伸,加入一个碱基,拍照,去保护,再延伸下一个碱基,周而复始,因为生化反应的效率不可能达到100%,对于单分子只要出现一次错误就会导致反应终止或错读,造成读长只能达到20几个碱基),目前已经基本淡出市场,最受业界看好的还是PacBio公司的RS system测序仪,其平均读长可以达到1.1Kb,通量7Gb/天,而且还有进一步提升的空间。但是,因为是单分子测序,测序反应中每个产生的错误都会被忠实的记录下来难以分辨,这就形成了目前此款测序仪最致命的问题,其准确性仅有85%,虽然可以通过重复测序进行一定程度的纠正,但相较于第二代测序技术动辄99.5%以上的准确性,确实是其最大的短板。当然,我们相信这一代测序技术还是可以在不断的成熟过程中最大程度克服其技术劣势的。

目前还有很多概念性测序技术的研究,主要技术特点是抛弃了在复杂的酶促生化反应中进行序列读取,而更多的利用碱基的电学特异性差异,通过纳米孔、石墨烯、半导体或者微电极等直接对碱基穿过电极时的电流差变进行测量。通常这种电流变化都是nA甚至pA级别的,从目前的进展来看,很难在短时间内实现高通量并行化上的突破。我们并不否认今后会有其他领域的技术飞跃给这一类测序技术提供技术实现的可能,至少从现在的研究结果来看,还有很长的路要走。我们把这一类不需要生化反应伴随、不需要化学试剂产生反应的测序技术归纳为第四代测序技术。

理想而完美的测序技术是什么样子

由此我们可以看到,测序技术的发展呈现着一种层出不穷的态势,而到底有没有一项能够满足我们所有需求、真正理想和完美的测序技术呢?

我们知道人类探求生命奥秘的需求是随着研究的深入而不断扩张的,但现在仅仅就目前的研究现状而言,探索通向理想而完美测序技术的路上,有如下几个一定要解决的关键问题:第一,可以完整地解读每个DNA分子或称染色体的序列信息。它们的长度范围在几千个核苷酸到几亿个核苷酸之间,显然我们目前的测序技术距离这个目标还有很远的距离,使之成为可望而不可及的终极目标。第二,如果我们不得不将DNA分解成不同片段来解读的话,我们必须要有高覆盖(一般在十倍到百倍之间)的重叠群序列,才能利用重叠的信息将测定的片段连接起来。序列读取质量(帮助我们精确判定片段之间的重叠)和序列读出长度(保证长距离的连续性)就成为两个不可或缺的重要参数。而且,理想状态下,DNA测序仪的一次性序列读长决定了DNA序列组装的连续性(Lander-Waterman定律)。第三,不同物种和每个物种的基因组序列都有不同程度的变化,从百分之几到千分之几,我们必须要测定成千上万的个体所具有的序列,才能充分发现这些基因组的多态性,因此通量和工作效率成为测序技术的永久需求,就像电脑的运算速度一样永远不会得到人们的满足。第四,在实际生命中,DNA分子并不是仅仅由简单的四种碱基组成,还至少有另外三种修饰:甲基化、羟甲基化和糖羟甲基化,而且它们在DNA分子上还表现出很大的不均一性,目前的测序技术还不能直接测定这些修饰的存在。另外,我们现在只能通过测定DNA序列的技术来间接地测定各种活性RNA分子的序列,但是RNA序列不仅有逾百种化学修饰,而且在每种细胞、细胞的不同状态、乃至每个细胞中都有所不同。可见对测序技术的需求是无止境的。因此,单分子水平的DNARNA序列的测定成为基因组学研究和分子生物学研究的新需求。第五,由于实际需求的完美性和现有技术的局限性,部分满足不同需求的DNA测序仪(如第一代和第二代测序仪)有长期存在的可能性。这种可能性使对下游配套技术(如数据处理和分析等)的需求增加。

所以说,就像我们在追求笔记本电脑的完美性一样,既需要运算速度快,又希望轻便省电,同时还要价格低廉,但没有任何一台电脑能够同时满足所有的需求,测序技术也是如此。因此,不同代次的测序技术依然会长期共存和继续发展,力求达到各自的性能极限甚至冲破各自特有的技术瓶颈,另一方面,新的测序原理和技术也将不断产生出来,以满足不同层次的应用需求。而这一切,则依赖于也同样驱动着今后众多相关技术的发展和进步。

一年、两年、五年、十年后的测序技术发展趋势

期待理想而完美的测序技术出现,必然需要在现有的技术体系上实现突破,这就意味着测序技术的发展必然是由一系列技术革命催生而来的。这一系列技术革命远远不止于生命科学本身的范畴,而更多的需要依赖于众多学科专业的进步及其与生命科学的融合。

目前上市的测序系统,包括第一代和第二代测序仪,绝大多数是依赖于在生化反应(聚合反应和连接反应)过程中通过特定碱基产生的荧光来进行识别,也就是说信号获取是通过光学检测来实现的。这也是第二代测序仪此前不能实现单分子测序的主要原因之一,因为单分子荧光检测对于光学器件的灵敏度和视场背景干扰的消除等技术要求非常苛刻。近年来光学技术的发展及其与生命科学的融会贯通给这一难题提供了有力的解决方案,如HelicosHeliscope测序仪采用了全内反射式显微镜对单分子荧光进行获取;PacBioRS系统利用了物理学的零模波导原理消除背景。

第二代测序仪队伍中刚刚加入了一个技术上的另类,当然也可以说成一次技术上的飞跃,就是Life Technologies2010年收购的Ion Torrent公司发明的PGM测序仪,这是第一种商品化的不通过荧光观测进行测序的设备,其利用每个碱基的聚合反应中都会产生一个质子,从而改变了测序池体中的pH值,而每个池体底部则由集成电路构成专一的pH传感器装置来进行检测。目前已经上市的Ion 314芯片具有120万个传感器,即将上市的Ion 316芯片具有610万个传感器,预期年底上市的Ion 318芯片则达到了1200万个传感器,而这一切则需要归功于半导体芯片技术的发展和应用,难怪Ion Torrent公司声称其技术基础依赖于半导体工业40年来高达1兆美元的前期投入和积累。

不同领域技术融合的特征还表现在另外一个方面,即材料的微纳加工上。第一代测序仪的革新之一就是将大体积的平板胶电泳变成了纤细的毛细管电泳,除了设备体积得到优化外还使每个测序过程单独封闭,避免了相互间的干扰。到第二代测序技术出现后,其中结合有核酸分子的微球目前据称最低已经达到了几百纳米的直径,特别是Roche公司的454测序仪应用的测序芯片,是由数百万根30μm直径的光纤构成的,而且每根光纤一端的芯层还被腐蚀出40μm深的池体作为单个测序反应的独立空间。第三代测序仪在这方面就更加突出,PacBioRS系统测序芯片因为应用零模波导原理的原因,其芯片是在玻璃上方用铝加工出一系列直径50nm100nm的池体,目前这种工艺还只能通过高分辨率的电子束曝光技术来实现,因为电子束曝光工艺处理的面积有限,造成这一设备的单次运行通量和单位时间运行通量现阶段还不能达到第二代测序仪的高度。

从这里我们可以看到一个测序仪技术组成的发展趋势,就是随着测序仪代次的更迭,实现测序目的的技术权重已经逐渐由偏重生化反应转向偏重物理学、材料科学等非生物学科。第一代测序仪仅仅是提供一个电泳和电泳后分析的平台;第二代测序仪则利用微加工处理和光电子成像技术实现边反应边测序;第三代测序仪则将反应体系进一步缩小到了微纳米量级的尺度,同时利用物理原理实现了单分子识别;而目前正在进行概念研究的第四代测序技术几乎完全抛弃了生化反应,通过力学、电学等对DNA分子中的碱基直接判读。所以说,未来的测序技术发展将主要依靠微纳加工技术来实现测序微环境的结构形成,依靠物理学手段来进行识别,生物学范畴的内容也许还会存在,但只能起到辅助功能,而技术革命必将来源于其他学科在这一领域的应用。换言之,更全面的实现跨学科跨专业的交叉和融合,是测序技术发展的必由之路。

第二代测序技术自2005年实现至今仅仅6年的时间,但给我们的感觉就像是飞跃了一个世纪。未来的几年这种发展是会陷入技术的瓶颈还是继续甚至更迅猛的实现突破?人们对生命科学的探知欲望是在与日俱增的,对于测序技术这一获取生命信息的直接手段将会更加的依仗,需求只会不断增长,这也将给技术发展以更强有力的推动。

从目前普遍应用的第二代测序技术来看,受技术本身的限制,通量和读长可能还会继续增长,但增速可能很难达到之前如此陡直的斜率,我们大胆的预测,当Roche454达到读长1Kb通量1GbSOLiDHiseq达到通量1Tb,可能就会进入平台期,这是目前采用的测序原理技术本身可能达到的极限,世界上没有永动机,也没有无限增长的测序通量。从发展速度来看,乐观估计2012年就有可能达到这一目标了。对于目前研究界所热衷于的工作中,诸如人类基因组重测序、转录组、新物种基因组框架图、宏基因组、泛基因组等等研究,大部分都可以满足需要,但对于一些目前只能通过间接手段开展的工作,如表观遗传学等,期望用第二代测序技术大批量进行则因为技术原理的局限而力有不逮了。

第三代单分子测序技术为发现基因组中此前未阐明的内容提供了技术手段,但即使是一枝独秀的PacBio仍然有很多问题需要解决,但是其最主要的关隘已经获得了突破,所以我们有理由相信,也许2013年就是第三代测序技术全面应用的元年。有人认为,当第三代测序技术发展成熟之后,也许之前所有曾经完成测序的工作都要重新来过一次,虽然并不能全部推翻此前的工作结论,但是可能发现和修正很多我们之前认为已经证据确凿的研究内容。科学实际就是在这样的反反复复中不断成熟和深入的。

在现阶段看来,还没有一种第四代测序技术真正具有实用性价值,但不得不说,已有的概念性研究给我们展示了一幅美好的未来前景,无论是纳米孔、纳米管、石墨烯、纳米电极这类穿孔测序,亦或是电子显微镜这种直接观测的形式,也许在今后不远的一天,我们会突然发现,测序已经远远突破了所谓百美元一个基因组的期望,甚至实现零成本。我们还是来进行一次假设,根据技术发展的规律和测序技术本身的进化特点,具有实用价值的第四代测序技术和测序仪概念机可能会在5年后崭露头角,而真正可以形成市场估计至少还要让我们再等5年。当然,测序的需求不会在这10年间有所降低,相反可能会有更大的空间和更高难度的技术要求,比如全面解析DNA的三种修饰(也许会发现更多种的修饰)和RNA的上百种修饰的生物学意义,或是可以快速对普通疾病的核酸标记进行检测的家庭化测序分析系统。在2000年的时候谁又想到了如今我们已经获得了近2000个物种(不包括已经完成基因组测序的近2600种病毒)的基因组呢?

我们该做点什么?

此前我们一直忽略了一个对于测序技术非常关键的因素,那就是价格问题。人类基因组计划开展伊始阶段,计划用30亿美元完成人的基因组测序工作,相当于每个碱基需要花费1美元,而现在的主流测序设备完成一个人的基因组测序工作只需要一万美元甚至更少(当然,对测序数据进行处理和分析的成本还至少需要几十万美元)。可以看到,在测序成本方面已经比十几年前降低了6个数量级,而随着第二代测序技术的进一步发展和第三代、第四代测序技术的崛起,实现千美元一个基因组百美元一个基因组已经不是一个遥不可及的梦想。

虽然测序成本的降低是大家都乐于看到的,但当我们从整个市场来看,现阶段几乎所有的生命科学研究都需要应用到测序技术,就中国而言,在2011年的测序市场可能就将达到10亿美元,其中小部分会用于测序仪设备的购置,而大部分将消耗在测序试剂上。按照普遍的市场规律,当一代技术成熟和下一代技术即将推出之际,将产生市场价格的回落,但是,目前来看,市场价格呈现一种不降反升的态势,又是什么原因导致这种违反市场规律的情形出现的呢?

目前包括第一代和第二代测序仪均出自三个主要厂商:RocheIlluminaLife Technologies。我国市场上的设备和试剂均来源于从这三个厂商的进口,研究者不得不承受比厂商所在国家更高的设备购置和应用费用,而国内的测序服务业的成本甚至会高于国外服务商的市场报价。结合我国的测序市场需求,相信仅仅从科研的应用成本上而言,受制于人这个词汇不可谓不贴切。

而从以往经验来看,往往国外设备试剂的更新换代,首先会满足本国的需求,这样就造成了我国总是比国外滞后半年甚至一年的时间应用更高效的研究工具。以PacBioRS系统为例,在2010年该公司提供了10台设备在研究机构中试用,没有1家中国科研机构获得这样的机会,种种这样的原因造成我国的科研水平难以与国际高端竞争,就在201116日,第一篇应用该设备的论文发表在国际顶级刊物《新英格兰医学杂志》上,而这个时候,几乎没有几位中国科学家见过这台测序仪的真实样子。另一个例子,Life Technologies公司的Ion Torrent PGM测序仪2010年底就在美国上市了,在20112月召开的基因组学顶级学术活动AGBT会议上,多个机构的学者就发表了他们应用这一设备所开展的研究工作。但对于中国用户,到20113月才能够开始下达订单,这就造成了我国在技术能力上至少半年以上的滞后。同时,该设备在美国的售价大约为每台5万美元,而据LifeTech的市场人员介绍,在中国的报价大约为20万美元,即使成交价能够打个对折,还是要比美国本土翻了一番,这又让我国的科学家情何以堪。为什么会造成这样的局面,归根结底是我们缺乏自有设备给予其市场竞争压力,而不得不接受这样的现实。

我国缺乏大型高端科研设备的研发经验和综合能力,这是现阶段一个不争的事实。但对于中国这样一个经济、科技高速发展的国家,恰恰需要将此前展现出来的劣势进行弥补和突破,才能符合现实的需求。在这里还要插播一个小故事,前文中提及的Ion Torrent PGM测序仪,其发明人Jonathan M. Rothberg恰恰是Roche公司454测序仪的发明者,454的测序原理是通过聚合反应中释放出来的焦磷酸来进行碱基的识别,而PGM则是检测聚合反应中释放出来的质子,大家都在期望Rothberg的下一个发明又会利用释放出来的什么物质来测序呢。这个故事非常明确的告诉我们创新能力对应抢占科学制高点和建立产业优势的重要性,而创新能力、交叉学科水平、工业设计能力也是体现一个国家综合科技水平的重要体现方面。近年来我国也在这些方向开始进行大规模投入,对于测序仪的自主研发而言,正是提升这一水准和解决应用瓶颈的重要举措。

目前国内开展测序仪研发的机构主要有三个,中科院北京基因组研究所和中科院半导体所联合研制的第二代测序仪(焦磷酸测序原理)、无锡艾吉因生物信息技术有限公司(连接酶测序原理)和深圳华因康基因科技有限公司(连接酶测序原理)。虽然在这个领域已经开始起步,但很大程度上还是属于引进吸收,缺乏原始创新。国际上日益激烈的第三代和第四代测序技术的研发给我国一个追赶和超越的机会。在获得前期积累的实战经验基础之上,加大投入支持力度,充分开展跨学科跨专业的合作,积极开展原始创新,建立自主的知识产权体系,才能在这样一个关键节点上真正实现质的突破,从根本上实现我国生命科学事业从追随到超越的跨跃式发展,从而在世界科学舞台上,发出中国科学家自己的声音。

注:本文作者为中国科学院基因组科学及信息重点实验室,北京基因组研究所的任鲁风及于军。