RNA甲基化作为真核生物中最常见的转录后修饰,一直未得到广泛研究。近期研究发现RNA甲基化也是可逆的表观遗传修饰,有着重要的生物学功能。因此成为表观遗传研究的新热点,并有多篇相关文章在nature、cell等国际重要期刊上发表。
dafabet手机黄金版与客户合作,发表2017年最新表观遗传学研究文章,通过MeRIP-seq技术首次构建了猪的RNA甲基化谱,并讨论了RNA甲基化在肌肉和脂肪组织中的功能。文章发表于BMC Genomics。
文章摘要
背景:在高等生物中,N6-methyladenosine(m6A)是mRNA最常见的修饰形式。可逆的m6A修饰对mRNA的调控作用已经在多个物种被揭示。此外,m6A修饰在不同的组织中会呈现特异的甲基化模式,且会随着细胞或物种生存环境的变化而改变。然而,迄今为止m6A在猪转录水平上的分布及其在脂肪沉积和肌肉发育中的功能还未见报道。
方法:在本研究中,我们收集了三个不同猪种(野猪、长白猪、荣昌猪)的肌肉和脂肪组织,并应用methylated RNA immunoprecipitation with next-generation sequencing(MeRIP-seq)技术首次获得了m6A在猪转录水平上的分布图谱。
结果:我们在肌肉和脂肪组织的mRNA中分别得到5872和2826个peaks。这些peaks主要富集在终止密码子,3’非翻译区及基因编码区。GO分析发现核内基因的共有peaks与转录因子相关,这表明m6A甲基化与核内转录密切相关。一些基因存在组织和物种间的m6A甲基化差异,并且获得新的生物学功能。此外,我们还发现m6A甲基化程度与转录水平密切相关,揭示了m6A对基因表达的调控作用。
结论:这些结果为RNA甲基化修饰在脂肪沉积和肌肉发育中的功能的研究奠定了坚实的基础。
研究背景
N6-methyladenosine(m6A)在1970s第一次被发现,是高等生物中mRNA和lncRNA最常见的内部修饰。m6A修饰是由包含两种甲基转移酶(METTL3和METTL14)的多成分复合物催化的。这两种甲基转移酶形成一个异二聚体与WTAP蛋白相互作用,在体内影响mRNA甲基化的产生。2011年发现两种m6A去甲基化酶(FTO和ALKBH5)会有选择的逆转核内RNA的m6A甲基化。与DNA和组蛋白甲基化类似,这一发现使得RNA甲基化修饰也呈现出可逆的动态变化,并且重燃了对m6A生物学的研究热情。另外,人类YTH蛋白家族是m6A的reader蛋白,可以特异性的识别m6A修饰的mRNA,并引导其发挥功能。
许多研究表明RNA的m6A在细胞代谢过程的调控中起到重要作用。例如,控制哺乳动物胚胎干细胞的细胞命运转变,调控小鼠干细胞的多能性等。FTO依赖的m6A去甲基化调控mRNA切割,并且是脂肪生成必须的。m6A甲基化在人类疾病中也发挥了重要作用,例如控制HIV-1的复制,在肺癌中促进致癌基因的翻译等。最新研究表明,m6A介导了果蝇的性别决定,促进了哺乳动物XIST基因介导的转录抑制。
为了研究RNA甲基化修饰的生物学功能,就需要一种可以在转录水平上检测m6A修饰的方法。2012年,Dominissini等科学家开发出了一种新的测序方法:methylated RNA immunoprecipitation with next-generation sequencing(MeRIP-Seq),可用于转录水平上RNA甲基化的检测,且首次在人类和小鼠中分析了m6A在转录水平上的分布。随着该技术的发展,其他真核生物(酵母,拟南芥,水稻)中也实现了m6A谱的研究。这些研究发现m6A的特点是主要分布于终止密码子和3’-UTR附近。同时,m6A在外显子和转录起始位点处也有富集,表明m6A可能对转录后基因表达调控起到关键作用。这些开创性的的研究表明,构建转录水平上的m6A甲基化图谱对揭示m6A修饰的生物学功能有着重要意义。
研究思路
研究结果
1. 猪中m6A修饰的检测
我们用MeRIP-seq技术检测了210日龄长白猪的肌肉(LM)和脂肪(LA)的m6A甲基化。数据过滤后,每个LM样本获得超过37400000条高质量序列,而LA样本得到30600000条高质量的reads(图1a)。超过70%的reads可以唯一比对到参考基因组。为了减少假阳性率,我们同时检测了每个组织的input样本。在LM和LA组中分别有80%和70%的相同peaks可以在生物学重复中检测到。接下来就用这些高度富集的peaks进一步分析。在LM组中,共检测到4544个编码基因的5872个peaks;而在LA中则检测到2173个编码基因的2826个peaks(表1和图1a)。我们通过深入分析得到LM和LA组中每个转录本分别包含0.562个peaks和0.254个peaks(图1b)。
为了确定找到的m6A peaks是否包含保守的RRACH (R代表嘌呤,A代表m6A,H为除G以外的碱基)motif,我们进行了motif分析。每个样本显著富集的peaks中我们都找到了RRACH保守序列(图1c)。这些发现使我们分析得到的peaks更加可信。
表1 肌肉和脂肪中m6A peaks的统计分布
图1 猪m6A甲基化的概述
2. m6A修饰在基因功能元件的分布特征
为了理解m6A在转录本上的偏好位置,我们研究了peaks在基因功能元件的分布。我们发现peaks在两个区域出现了剧烈的变化:一个是在5’-UTR终止和CDS起始位点附近;另一个是在CDS终止和3’-UTR起始位点附近。并且CDS终止位点附近的peaks要显著多于CDS起始位置(图2a)。为了更好的分析peak的富集情况,我们将peak比对到6个不同的转录元件:5’-UTR,起始密码子,CDS,终止密码子,3’-UTR及其他。结果发现大部分peaks分布在基因区域内,并且有超过60%的peaks富集在终止密码子和CDS附近(图2b)。这些结果在所有样本中趋势一致,表明m6A甲基化分布具有一定的保守性。
图2 猪转录本上m6A甲基化的分布
3. RNA甲基化关联基因参与重要的生物学功能
为了进一步研究m6A甲基化在动物组织发育中的功能,我们找到了不同样本的共有peaks,并关联到相应基因。我们共鉴定到1957个共有peaks(图1a),并关联到1615个编码基因。GO分析表明,编码这些基因的mRNA主要富集在核内,且与多种细胞功能相关,例如:蛋白结合,核酸结合,转录因子活性等(图3a)。随后我们将甲基化关联基因分为四个亚组:PeakStart,PeakStop,PeakBoth和其他,并对这些亚组进行GO富集分析。所有的亚组都能富集到与细胞核相关的GO功能,并且有超过48%的基因属于PeakStop亚组(图3c)。接下来我们对PeakStop亚组里的基因进一步分析。结果发现大部分基因编码转录因子,表明m6A修饰与转录调控相关。例如,我们的数据显示CREB和ZNF基因的终止密码子附近存在明显的peaks(图3d)。综上,这些结果证明mRNA甲基化与细胞核内的转录密切相关。
图3 共有peak关联基因的功能分析
4. m6A修饰参与不同组织间的差异调控
除了共有peaks外,不同组间还存在组织特异性peaks。我们共鉴定到3915个LM特异性peaks,869个LA特异性peaks(图1a)。这些peaks分别关联到了3034和562个组织特异性甲基化基因(TSMG)。GO分析结果表明,LM组的TSMG主要与能量调控的信号通路相关,如胰岛素信号通路及AMP激活蛋白激酶通路等。而LA组的TSMG主要与脂肪酸代谢和系统发育等功能相关。我们m6A-IP的结果表明,LM组的胰岛素信号通路中Irs1和Foxo1基因的5’-UTR,终止密码子和CDS存在peaks的富集,而LA组中没有(图4b)。随后,我们根据MAnorm模型寻找组间存在显著差异的共有peaks。结果鉴定得到382差异peaks,并关联到319个差异甲基化基因。GO功能分析发现这些基因与蛋白结合及细胞迁移过程中细胞极性的建立等功能相关(图4c)。
此外,我们同样分析了不同基因区域差异peaks的富集。结果发现,不管在终止密码子,起始密码子还是同时覆盖这两个区域,LM组的peaks比LA组明显要多(图4e)。GO分析表明组织差异甲基化基因主要富集到细胞核,并且与代谢调控和蛋白结合相关(图4f)。
为了进一步探究m6A甲基化是否能调控基因的表达,我们找到了两种组织的差异表达基因。结果发现2988个基因在LM组中高表达,3264个基因在LA组中高表达。在LM高表达基因集中,与LA组相比,LM组有更多的基因包含peaks(1012/312)。而在LA高表达基因集中,LA组包含peaks的基因却比LM组少(495/581)(图4g)。这些结果表明,每种组织都有其特定的m6A甲基化水平,并与基因激活相关。
图4 不同组织差异甲基化基因的功能分析
5. 不同猪种间的m6A修饰
为了应对环境变化和遗传背景的差异,m6A介导的基因调控可能存在物种间的差异。为此,我们进行了不同猪种间的m6A分析,并探究了其修饰的生物学功能。我们对遗传背景不同的三个猪种(野猪WB、长白猪LD、荣昌猪RC)的肌肉组织进行了MeRIP-seq测序,结果得到了约6500-7500个peaks,且WB组甲基化水平最高,RC组甲基化水平最低。随后我们对三个猪种间的m6A甲基化进行差异分析,鉴定了物种特异的甲基化peaks及其关联基因(BSMGs)。在WB和LD组间,分别得到了2155和1843特异性peaks,关联到2846个BSMGs。同样,在WB和RC组间我们发现了2510和1912个特性peaks,关联了3186个BSMGs。而RC和LD组间分别鉴定到1709和1432个peaks,并关联到2285个基因。GO分析结果表明,这些BSMGs主要与转录因子结合,细胞代谢过程等基本的生物学功能相关。
接下来,我们根据MAnorm模型寻找两组间存在甲基化差异的共有peaks,并将这些peaks关联到包含甲基化差异的基因(BDMGs)。首先,在WB和LD组间我们找到219个差异peaks,关联到了171个BDMGs。GO分析表明这些基因富集在细胞外基质,且与丝氨酸/苏氨酸蛋白激酶,磷酸转移酶活性等功能相关(图5a)。例如,与WB组相比,LD组MAP3K14 基因(一种丝氨酸/苏氨酸蛋白激酶)的3’-UTR附近存在显著的peaks富集(图5d)。其次,我们在WB和RC组间发现了296个差异peaks,关联到240个BDMGs。这些基因也显著富集在胞外基质,并且与受体结合,粘多糖结合及心血管系统的发育相关(图5b)。最后,我们在RC和LD组间找到了112个共有差异peaks,关联到89个BDMGs,并进行了GO 分析。结果表明,这些基因主要富集在生物素结合,生物素蛋白连接酶活性,脑信号蛋白受体活性等功能(图5c)。此外,我们的测序结果表明,RC组的HLCS基因(一种催化生物素与蛋白结合的酶)5’-UTR附近存在显著的peaks富集(图5d)。
图5 不同猪种间差异甲基化基因的功能分析
参考文献:
Tao X, Chen J, Jiang Y, et al. Transcriptome-wide N 6-methyladenosine methylome profiling of porcine muscle and adipose tissues reveals a potential mechanism for transcriptional regulation and differential methylation pattern[J]. BMC genomics, 2017, 18(1): 336.