简化基因组技术浅谈
简化基因组技术,顾名思义,就是利用各种技术手段降低物种基因组复杂程度,进而对基因组各类结构变异进行研究。早在2000年,Nature杂志就已经有文章提出简化基因组这一概念[1]。
那么,为什么要开展简化基因组研究呢?简化基因组技术有哪些优势呢?目前,市场上存在哪些简化基因组的产品,这些产品又分别适用于哪一类研究项目呢?这里,小编就给大家做一个简要的介绍。
首先,我们来谈谈简化基因组诞生的背景:在基因组学的高通量时代来临之前,前辈们就已经开发出了很多的分子标记应用于遗传学研究,辅助育种,基因定位等各个领域,比如我们熟知的RFLP、STS、RADP、SSR等标记类型。较之以往的表型标记(比如著名的孟德尔豌豆实验中的红白花等性状),细胞学标记(染色体核型、带型此类)和蛋白质标记(特异性酶等),这些分子标记表现稳定,理论上遍布整个基因组,多态性高,多表现出共显性特点,便于开展基因组研究,也因此在一段时间内“火遍了大江南北”。然而,传统的技术手段能够获取的分子标记数目少,分辨率低,分布不均匀,仍旧局限了这些分子标记的开发和利用。最最重要的是,在高通量时代到来之前,想要获取到这些分子标记,那你必须得“土豪”到一种境界:情商智商都高分,有钱有闲有定力。
高通量测序时代的来到,全面挖掘分子标记信息已经不再是难事儿。“拉出来,测个序嘛”。你想要的信息,基本上勾勾小拇指,都能“八九不离十”。但前提依然是:有钱!有钱!有好多好多钱!稍微研究个高等动植物,几个G的基因组,测序量大,重复序列多,复杂度高的,那你一定要有“视金钱如粪土”的傲娇劲儿,做土豪,就得这么任性!任性之后,还有浩如烟海的数据在朝你招手~~就问你怕不怕!
然而,劳动人民的智慧是伟大的。简化基因组技术在这个时候应运而生。它的优点是什么呢?省钱呐,这个是必须的。另外,由于降低了研究对象基因组的复杂程度,省钱省数据的同时,数据利用率得到了明显提高,速度也是杠杠的快,结合SNP标记,高密度分子图谱的梦想完全可以实现——绝对的高性价比组学研究神器啊。
那么,这种神器怎么玩儿呢?看这里,小编带您操练起来!
首先来看堪称经典的RAD技术(Restriction-site associated DNA sequencing),即限制性酶切位点相关的DNA测序技术。这种技术的思路是:利用限制性内切酶对基因组进行酶切,产生一定大小的片段,构建文库,对酶切后产生的DNA序列进行高通量测序。获取的是酶切位点附近的基因组序列信息,挖掘酶切位点附近的分子标记[2]。
2010年,康奈尔大学发表文章介绍其发明的GBS技术(Genotyping-by-Sequencing), 即基于测序进行基因分型。这种技术也是基于限制性内切酶,对酶切位点附近的基因组进行研究。区别于RAD技术,GBS技术不进行片段的选择,获取的SNP标记信息较RAD技术要少。但是其建库方便,不需要切胶,是一种十分快捷高效的的简化基因组研究方法[3]。
2012年,2b-RAD技术诞生[4]。这个简化基因组技术区别于既往RAD和GBS技术。同样是酶切,2b-RAD技术基于II型限制性酶切开展的。这种II-B型内切酶,识别位点在中心,酶切位点在两边(下图),这样一来酶切获得的片段长度都是固定的,且由于片段很短,通过测序是可以实现测通的。这种类型的简化基因组,可以涵盖全基因组的几乎全部限制性酶切位点,可以更有效的进行PCR和测序,尤其适用于杂合位点高、基因组不是很大,重复序列不多的物种类型。
近些年来,简化基因组技术的发展更是百花齐放,百家争鸣,除了上面为大家介绍的几个常见的技术之外,SLAF-seq技术、基于双酶切的RAD(dd-RND)和GBS(dd-GBS)技术等也都是简化基因组大家族的重要成员。虽然比不上全基因组测序的波澜状况,但小到分子标记开发,大到遗传辅助育种,遗传图谱构建,基因定位及遗传多样性研究等,简化基因组技术都有它的用武之地,可谓是“上得厅堂,下得厨房”的楷模。与此同时,也不断有新的技术优化引入到简化基因组的开发中。
2016年初,dafabet手机黄金版联合复旦大学罗泽伟教授课题组,成功开发出了一套全新的、具有自主知识产权的简化基因组 RAD-seq 技术平台。这种优化的实验技术平台,可以实现研究项目所需的基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析。同时,它的最大优点和特色在于,通过两轮的酶切,它可以有效去除来自于叶绿体、核糖体(或是线粒体)等冗余 DNA 测序 reads,进而提升基因组数据的利用率。
整个试验建库的流程如下图:
这套新的RAD技术是如何实现上述功能的呢?它的建库测序过程是怎么样的,获取的数据信息情况如何?能否与我们之前的研究相吻合吗?感兴趣的各位亲们,可以点击下面的文献解读,让小编带着你们一起来看一看这个技术的应用吧。
参考文献:
[1] An SNP map of the human genome generated by reduced representation shotgun sequencing. Nature. 2000, 407(6803): 513-516.
[2] Rapid SNP Discovery and Genetic Mapping Using Sequenced RAD Markers. PLoS Genetics. 2008,3(10): e3376.
[3] A Robust, Simple Genotyping-by-Sequencing (GBS) Approach for High Diversity Species. PLoS One. 2011, 6(5): e19379.
[4] 2b-RAD: a simple and flexible method for genome-wide genotyping. Nat Methods, 2012, 9(8): 808–810.
[5] A highly robust and optimized sequence-based approach for genetic polymorphism discovery and genotyping in large plant populations. Theor Appl Genet, 2016, s00122-016-2736-9.