Recommendationsfor the design and analysis of epigenome-wide association studies
全表观遗传学组关联分析的方案设计以及数据分析
文章摘要
全基因组甲基化关联分析可以帮助我们检测容易受环境因素影响的新的调控机制。全表观遗传组关联分析通过在为数众多的CpG位点进行筛选容易受环境因素影响的位点,但是由于数据的复杂性阻止了我们从噪音中选择稳健的信号。通过合理的实验方案以及利用以往的先验知识,可以帮助我们获得更加可信的结果,进一步降低研究结果的假阳性。本文主要介绍了合理的实验方案的选择以及数据分析方案,包括甲基化特征的选择,样本的选择以及如何获取合适的组织样本。
1 研究背景
GWAS研究让我们找到了许多从前未发现的基因以及染色体区域,为复杂疾病的发病机制提供了更多的线索。虽然GWAS为复杂疾病的致病基因定位提供了强有力的手段,但是越来越多的研究表明,复杂疾病的致病原因是多样化的,基因组遗传信息的变异是导致复杂疾病的重要因素之一,除此之外,表观遗传学的变异在复杂疾病的发生发展中也起到很重要的作用。GWAS所采用的研究策略仅仅局限于遗传信息的变异,而无法在表观遗传学层面进行复杂疾病的解读。
EWAS技术的出现弥补了GWAS的不足,将表观遗传学变异和复杂疾病进行关联,在表观遗传学层面对复杂疾病的致病原因进行解读,找到与致病原因相关的表观遗传学变异位点。EWAS为人们打开了一扇通往研究复杂疾病的大门,将在患者全基因组范围内检测出的甲基化变异位点与对照组进行比较,找出所有的甲基化位点的变异频率,从而避免了像候选基因策略一样需要预先假设致病基因。同时,EWAS研究让我们找到了许多从前未发现的与疾病相关的甲基化位点,为复杂疾病的发病机制在表观层面上提供了更多的线索。
2 研究方法
图1 实验流程
3 研究方案
图2 EWAS研究方案流程图
4 研究成果
4.1 EWAS介绍
EWAS的方案设计和数据分析方案基本类似于GWAS(图2,3)。
图3 EWAS数据分析流程图
样本的配对方案有四种:control vs case;家系样本;双胞胎样本;时间序列的样本(图4)。
图4 DNA甲基化配对方案选择
EWAS样本量选择control和case组各400例以上(图5)。
图5 EWAS样本数量的选择
EWAS研究项目中一般选择的DNA甲基化检测方案以illumina450K芯片为主(图6)。
图6 EWAS中使用的甲基化检测方法
甲基化变异特征有MVP,DMR,VMR,ASM,HSM。(图7)
图8 DNA甲基化变异特征选择
4.2 EWAS存在的问题
由于DNA甲基化属于连续变量,因此EWAS的回归模型相比GWAS要复杂。
另外甲基化相比SNP更由于受环境因素的影响,比如性别,年龄,抽烟,饮酒。
另外甲基化与基因组的遗传变异存在着关联性
EWAS候选位点的选择
EWAS的候选位点与GWAS也有区别之处:显著性;环境影响因素;功能相关;基因组的位置;后续的验证(表1 )。
表1 EWAS候选位点的选择