BSA混合分离分析法

BSA(Bulked Segregant Analysis)又称混合群体分离分析法,是利用极端性状进行功能基因挖掘的一种方法。主要思想是将两个具有极端性状的群体进行混池测序,比较两个群体在多态位点(SNP)的Allele Frequency(AF)是否具有显著差异。以植物株高性状为例,收集株高处于两个极端的样本分别混池测序,通过全基因组扫描,找到AF具有显著差异的位点,然后通过相关研究结果,对这些位点进行筛选,找到影响株高的功能位点。?

        BSA在1991年就被提出(Giovannoni et al., 1991; Michelmore et al., 1991),只不过当时使用的标记不是SNP而是RAPD和RFLPs等传统标记。随着二代测序的发展,SNP标记的开发和测序成本的下降,使BSA技术成为QTL定位的有力工具。?

       最近在BSA技术上的出色工作,主要为日本Iwate Biotechnology Research Center的一个团队。他们开发出了MutMap(Abe, A. et al., 2012)、QTL-seq(Takagi, H. et al., 2013)、MutMap+(R Fekih et al., 2013)、MutMap-Gap(Takagi, H. et al., 2013)等。???

        先来说说MutMap。MutMap的基本原理如图1,野生型(Wild-type)经过EMS诱变得到突变型(Mutant),筛选感兴趣的突变株经过多代自交后性状稳定后与野生型杂交得到F1,F1自交得到F2,将F2代中与野生型性状不同的个体混池测序(20-50株),同时将野生型测序作为参考序列。计算每个SNP的index(与参考序列不同的reads数占总reads数的比例),将SNP-index显著高于期望(可以通过bootstrap的方法检验显著性水平)的SNP位点作为引起该突变的候选位点。

技术分享图1 MutMap原理(Abe, A. et al., 2012)

       上面说得是标准流程,也可以直接用突变型自交得到子代池。这样整个流程就没有杂交的过程,适用于某些杂交困难的物种。?除了使用F2代,也可以用RILs群体,虽然周期长,操作复杂,但是适合定位微效QTL。

今天再说一说MutMap+和MutMap-Gap,两者都是基于MutMap。前者适用于不能用突变型和野生型杂交的情况,比如纯合突变是致死,不育或者严格自交且人工杂交困难的物种。后者适用于参考基因组和亲本基因组差异较大,比如存在SV(结构变异),而引起表型差异的突变刚好存在于亲本specific的区域(即亲本与参考基因组比较,存在SV的区域)。

MutMap+

      MutMap+的原理如图1,将野生型(WT)诱变得到的突变型(M1)自交得到M2,因为诱变产生的突变型一般是杂合的,在M1中不会表现出突变表型(尽管显性突变或者加性突变会在M1中表现,这里不作讨论,我们这里只关注隐性突变)。将M2种植后观察表型,统计野生型和突变型是否符合3:1的分离比(卡方检验),如果符合,我们认为该突变表型为隐性遗传。将M2野生型自交得到M3,选择M3野生型和突变型分离比为3:1的子代池,将两种表型各选20-40株混池测序(测序深度10 x以上),将测序结果比对到参考基因组,计算SNP-index(和野生型不同的reads占总reads的比例)。与MutMap不一样的是,在MutMap+中的两个混池中出现很多不是导致突变性状的SNP位点的index等于1(图1D),这是因为在M2中随机固定下来的突变的SNP(理解为遗传学中的奠基者效应吧),这些位点在两个池中同时存在,所以我们将突变池的SNP-index减去野生池的SNP-index后,得到的ΔSNP-index中,就消除了这种“干扰”,此时,我们将ΔSNP-index显著大于0(bootstrap或者说置换检验判断显著性)的位点作为候选位点(图1E)。

      文章中,作者也将野生亲本测序了,因为作者对这个亲本做了一些列的研究,在我们实际项目中,不测亲本是完全可行的:我们根据参考基因组计算SNP-index(与参考基因组不同的reads占总reads的比例),对应的,在ΔSNP-index中显著大于或者小于0的位点,都应该作为候选位点。

      直接用突变型连续自交的子代池计算SNP-index,这样做也是可行的。但是经过诱变后,连续自交后随机固定下来的位点较多,与亲本相比,会出现较多的假阳性。而MutMap+的两个池都是来自于M2,遗传背景一致,所以假阳性大大减少。

技术分享

图1 MutMap+原理图(R Fekih et al., 2013)  

MutMap-Gap

      MutMap-Gap和MutMap基本一致,只是多了一个de novo组装的过程。如图2,作者按照MutMap的流程,最后发现候选区域不存在导致基因功能改变的SNP,结合之前的研究,认为这段区域可能有SV,且导致突变表型的SNP位点存在于SV中。于是,如图3,作者收集了亲本unmapped的reads以及这段候选区域mapping上的reads,加上测一些mate-pair reads,作了de novo组装,然后将组装的序列和之前的参考序列一起作为参考序列再做一遍mapping以及从新计算SNP-index,作者发现,只有2个存在于组装序列的SNP-index显著,且通过基因预测,发现有一个SNP刚好导致了基因功能的改变(剪接位点)。

技术分享

图2 MutMap-Gap原理图aTakagi, H. et al., 2013

技术分享
图3 MutMap-Gap原理图bTakagi, H. et al., 2013

BSA系列最后一个方法:QTL-seq(当然,BSA的方法远不止这些,但原理是相同的,不同的是实验设计)。

QTL-seq与之前的MutMap系列最大的不同在于研究的材料不同:MutMap是用诱变得到的材料,而QTL-seq可用于自然存在的材料。

QTL-seq的原理如图,我们将两个具有极端性状(如株高的高矮)的亲本杂交,得到F1,F1自交后得到性状分离的子代池F2,经过检验发现F2的性状成正态分布,说明这是一个数量性状。我们将F2中的极高和极矮个体分别混池测序,计算每个SNP位点的SNP-index(该位点与参考序列不同的reads数占总reads数的比例),然后将两个SNP-index相减得到ΔSNP-index,我们将ΔSNP-index显著偏离0的位点作为候选位点。

 技术分享
图 QTL-seq原理((Takagi, Abe et al. 2013)

 

        这里可能会有人问,为什么不直接用两个极端性状群体的混池测序找差异位点,却需要杂交一次?这是因为这两个个体或群体可能亲缘关系较远,除了导致性状差异的位点,还存在大量和所研究性状无关的位点也存在差异,这样就给我们定位带来了麻烦。文章的后面就提到了,QTL-seq可以研究两个近期受自然或人工选择的群体,比如一个适应干旱环境,一个却不耐旱,比如一个高产,一个低产。文章建议分别混池测序具有极端性状的两个群体,而不经过杂交,这样做肯定没有经过杂交的可靠,因为这两个群体可能经过了长时间的隔离,群体中可能存在大量随机固定下来的差异位点,这会干扰我们的结果。不过,我们不仅仅看ΔSNP-index,重要是将ΔSNP-index按照滑动窗口拟合了曲线,这是结合了LD的思想:受选择的位点会因为LD的原因,将其附近的标记也一起遗传,如果这些适应性的性状是来自于少数几个祖先,那么结合LD就会为我们排除大量的随机固定的差异位点。同时,我们还可以结合染色体区段的多态性(如π和Hp),对结果进行验证:select-sweep作用会降低受选择位点附近的多态性。这样,就给不适合杂交的情况(比如某些动物很难人工杂交或者后代较少),提供了一个研究的思路。

文章来源:http://blog.sina.com.cn/s/blog_14cce7aed0102vq2p.html

文章来自:http://www.cnblogs.com/daimakun/p/5089174.html
© 2021 jiaocheng.bubufx.com  联系我们
ICP备案:鲁ICP备09046678号-3