Engage to Life Energy
dafabet手机黄金版特邀名师讲堂第二课,特邀了陈巍老师来为我们解读全球首篇使用10x Genomics 的商用Visium空间转库组测序技术的文章由Kristen R. Maynard发表在 BioRxiv的预印文章《Transcriptome-scale spatial gene expression in the human dorsolateral prefrontal cortex》,为方便大家学习,小编把PPT整理出来啦。
扫描二维码进入直播间观看直播回放
人类背外侧前额叶皮层转录组规模的空间基因表达
Transcriptome-scale spatial gene expression in the human dorsolateral prefrontal cortex
/
解读理由
一是因为这是自从10x公司把spatial transcriptome技术升级成Visium技术之后,科学家用visium技术发表的第一篇文章。当然这篇文章目前还处于预印阶段。
二是因为这篇文章讨论的内容很有趣,是专门研究人脑子的。而脑子可能是人身体上结构最精细的器官,它的精细结构与它的功能之间的关系最紧密。中国有句骂人的话,叫“神经搭错了”,意思指神经连接的错误会引起人行为的混乱,这句话充分说明了神经连接的精细结构与神经的功能之间有精妙的联系。那这篇文章研究的脑子的部位是“背外侧前额叶皮层”,英文是dorsolateral prefrontal cortex,简写是DLPFC,这块区域与人的工作记忆、认识灵活性、做计划相关。
三是因为这篇文章用到了许多分析方法,认识这些分析方法,有助于我们开拓科研思路。
实验方法
A、取3个死亡的神经正常的成年人的脑子,每个都是在DLPFC位置取4片切片。4片切片分成2组, 2组之间相距300微米,组内的2片是紧挨着的,每一片切片的厚度是10个微米。这样每个脑子取4片切片,一共3个脑子,那就是12片切片;
B、取完样本之后,用visium方法建库测序;
C、有了测序的数据,就可以把数据进行分层。以往对大脑皮层已经有许多的研究,人们已经知道大脑灰质的皮层分成6层,还可能会附带一些白质层,这样一共是7层;
D、接下来的分析,也是按照7层的结构来进行展开的。
分层富集基因
测完序之后,先做Spot的分层。
分层的方法,就是一方面用几个传统的标志基因来判定spot属于哪个层,同时做t-SNE的降维,根据计算的结果,再加入一定量的人为注释,把spot分配到各个层当中去。
接下来对这76个层做主成份分析,主成份分析也就是Principal Component Analysis,首字母缩写是“PCA”。PCA分析的特点在于可以在千变万化中找到主要矛盾。
这张图就是PCA分析后,用得到的第一个主成份和第二个主成份做的二维展开图。很有意思的是,在第一个主成份中,直接把白质和灰质分了开来,我们可以看到白质的点都在左面,灰质的点都在右面。
在第二个主成份中,就把灰质的6个层给区分开了。
有了分层的信息之后,我们对每个层当中有哪些高表达的标记基因进行进一步的验证和分析。
下面这几个基因,以前就已经知道是在某个层或某几个层当中高表达的标志基因,如:
CUX2在第2层高表达;CCK在第1、2、3、4、6层中高表达,尤其是在第6层高表达;RORB在第4层;ENC1在第2层;NTNG2在第6层。
这些是以往已知的标志基因中的一部分,被本次实验的结果所验证。
接下来的张图是通过本次visium的数据,分析得出的一些新的层特异高表达的标记基因:AQP4在第1层;HPCAL1在第2层;FREM3在第3层;TRABD2A在第5层;KRT17在第6层。而且KRT17有一个特点,就是它的表达,从第1层到第6层,基本是逐层递增的,到第6层的表达量达到峰值。
这样在之前的研究中有找到一些在特定层高表达标记基因,而这次的visium实验把所有的层、所有的基因都扫描了一遍,那就可以来审视一下,之前列出的那些基因是否是合适的层高表达标记基因。
这张图就是审视的结果。这里点的颜色表示排名,黄颜色排名靠前,紫颜色排名靠后。很明显,红线以上的这些基因是较合适的基因,红线下面这些基因,P值也不显著,排名也不靠前,是不太合适作为标记基因的。
这也可以理解,在之前,没有太好的工具来把脑组织,做一个既是广域空间、又是广谱基因表达量的分析,只能是根据很局限的信息来挑一些基因作为标记基因。那现在有visium这样强大的工具,一下子把广域的空间、和广谱的基因表达都看一下,那找出来的标记基因,就会更有代表性。
在分析过程中,发现了一个有趣的现象。左边是15172这个样本中,所有基因的分布情况。右边这张图是Hafner基因集当中的基因,这15172这个样本中的分布情况。我们很明显地看到Hafner基因集当中的基因,分布在图的两边,中间是完全没有分布的。
文章中提到了这个现象,但没有做更深入的分析。
那我去查了一下Hafner基因集,那是Hafner等人做的,是一个突触相关的基因集。也就是那个基因集里面的基因都与突触相关。
有兴趣的同学可以做进一步的探询,为什么中间一块会没有基因。
在分层分析当中,还对Spot做了无监督、半监督、有监督三种聚类分析:
i)无监督的聚类,用PCA方法的前50个主成份来做的聚类
ii)半监督的聚类,是用富集出来的差异表达基因,作为指导,对spot做的聚类
iii)有监督的聚类,是把以往做的标志基因作为监督条件,来进行聚类
文章中没有对哪个聚类的效果更好做评价,但我个人凭肉眼看,感觉是半监督聚类的效果最好。
临床意义
这张图里面是Visium数据和自闭症数据结合在一起,做分析的一个结果。
横向排列的是几个自闭症数据的数据集,格子的颜色是P值的显著性,越偏向深红,显著性越高,格子内标的是odd ratio。
SFARI是Abraham等人做的一个基因集,ASC102是Satterstrom等人做的一个基因集,里面是102个与自闭症相关的基因。这个数据集又被进一步分拆,ASD53这个基因集,就是ASC102数据集的一个子集,里面是主要是自闭症的基因。DDID49,是ASC102数据集里剩下的49个基因,这里面主要是神经发育延迟的基因。
DE是一组在自闭症患者中有差异表达的基因,DE这两个字母是differentially expressed的首字母缩写。DE.Up是其中表达升高的子集,DE.Down则是其中表达下降的子集。
分析得出的结论是第2层和第5层高表达的基因与自闭症高度相关。
接下来是各层与精神分裂症的关系。
在这张图里,左半边是空间转录组的分析结果,右半边是全转录组的分析结果,全转录组也就是传统的RNA-seq。明显可以看到,左半边图格子中的红颜色要比右半边图格子的颜色深得多,也就是说,空间转录组相比于全转录组是更加敏感的分析手段。空间转录组的差异的显著性要高许多。
那么这个分析得到的一个结果,遗传性的精神分裂症在第2层中有富集。
结合10x 单细胞分析
在以往的研究中,已经积累了大量的脑皮层的10x单细胞测序的数据。现在我们要把这些数据和空间转录组的数据结
分析。
先把10x的单细胞数据,通过富集的方法,把每个细胞簇归到对应的层。
把10x单细胞得到的分层数据放在横轴,把visium空间转录组的数据放在纵轴,进行热图比较。
我们可以看到,斜对角上是格子,都很绿,这说明10x单细胞分析得到的层数据,和visium分析得到的层数据有很好的对应关系。也就是说10x单细胞的数据,和visium空间转录组的数据是比照得上的。
有了这样的结论,带来的好处是,之前做的大量脑皮层的10x单细胞数据,现在可以比照到visium的皮层上,以开展更多的工作。
本文作者Kristen Maynard工作的LIBD研究中心,还建立起了一个空间转录组的网上在线分析平台,他们欢迎大家把10x单细胞数据和visium空间转录数据上传分析,他们提供的这个数据分析工具目前是免费的。
当然,我在这里要提醒一下大家,中国是有人类遗传资源出境管制的,任何的基因数据要传出国境,是要先申报的,申报得到批准后,才可以上传到外国网站上。
总结
A、visium是之前spatial transcriptome的一个升级版,实现了两个大的提升,1是把点阵的密度提高了,2是把实验时间从3天缩短到了1天。也就是说,在实验操作和数据精度两个方面,它都是一个更强大的工具。
B、visium得到的脑数据,与经典的脑子各层的高表达标志基因,是能够对应上的;而且visium方法还找出来许多新的最佳高表达标志基因,可以把原来的一些标志基因替换掉了。未来做实验,就可以选用更好的标志基因了,对各层的识别率会更高。
C、结合visium数据,把以前的自闭症、精神分裂症等的相关基因数据,做进一的步分析,并且把这些基因的表达更加精准地联系到脑的精细结构中去,这些数据的富集会提示疾病风险,同时也提供了新的脑科学的科研线索。
D、10x单细胞数据和visium的数据是可以对应上的。这样,之前做的大量的10x的数据就可以比照到新做的visium数据上,做更多更深层次的分析。LIBD中心还建了一个网上的在线分析工具,供大家上传数据进行分析。中国的同学,可以在遵守国家的人类遗传资源管理规定的条件下,经过申报,取得同意之后,去使用这个在线分析工具。
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy