Engage to Life Energy
CITE-seq是Cellular Indexing of Transcriptomes and Epitopes by Sequencing的首字母缩写。CITE-seq在传统的10x单细胞RNA测序的基础上,增加了针对细胞表面蛋白的检测,方法是增加带有DNA条形码标签的抗体一并做检测,以得到更全面更丰富的细胞信息。
文章概要
文章的题目,是《Simaltaneous epitope and transcriptome measurement in single cells》。翻成中文,就是《同时测量单细胞中的表位和转录组》
文章的第一作者,是Marlon Stoeckius,他是纽约基因中心的资深研究员
CITE-seq
CITE-seq是把对mRNA的单细胞测序,和对结合在细胞上的带标签的抗体进行单细胞测序,这样两个部分结合在一起组成的一种新的单细胞测序方法
其中mRNA的单细胞测序,和传统的10x Genomics的RNA测序原理是一样的。如果有同学不了解10x的RNA单细胞测序的原理的,可以在网上找一下【陈巍学基因】的第56期,里面有详细的对10x的RNA单细胞测序的讲解。
那CITE-seq就是在原来的RNA单细胞测序的基础上,再加上了抗体。抗体能够结合到细胞表面相应的蛋白上,另一方面抗体上带有特殊的DNA标签,我们接下来会详细地讲解这个标签的构成和作用
我们来看这个特殊修饰过的抗体
首先,所选用的抗体,就是要针对目标蛋白的,这个是最显而易见的。
接下来,是要在这个抗体上,连上一段特别的DNA序列,
这段DNA的序列上,第一段,是PCR引物结合区,也就是这段PCR handle,它的作用是在接下来的实验过程中,配合来自凝胶微珠的另一端的PCR结合区,把目标的DNA序列给扩增出来
第二段是针对这个抗体的一段序列,这段序列是每一种抗体都各自有一段独特的序列,它的作用是在测序完成之后,可以识别出这段序列是来自于哪个抗体的,然后再追朔到对应的是哪个蛋白,接着再通过计算这段序列的数量,推算出目标蛋白的数量
第三段是一段Poly(A)的序列,这段poly(A)的序列,是为了摸拟天然mRNA的poly(A)尾巴,它能够与后面微珠上的poly(T)序列结合,在聚合酶的作用下,合成出整条DNA链。
有了带标签的抗体之后,
接下来,是把带着标签的抗体与要检测的细胞悬浮液进行孵育,抗体会结合到细胞表面相应的抗原上。然后,把没有结合的抗体清洗掉,牢固结合在细胞表面的抗体则会被留下
下一步,是把带有抗体的细胞,加上带条形码的凝胶微珠,用10x Genomics公司的仪器,处理成油包水的乳浊液
乳浊液中是大量的油包水的小液滴,小液滴中包含了要做检测的细胞,细胞上连带着有标签的抗体,还有带DNA条形码的微珠
接下来,包在微滴中的细胞被裂解,
细胞中的mRNA就会被释放出来
微珠上的poly(dT)序列,会和细胞破裂后释放出来的带poly(A)的RNA结合,然后引导逆转录;
同时,poly(dT)序列也会和抗体上带的poly(A)序列结合,然后进行复制
这样,mRNA序列和抗体上的标签序列,都被转变成的DNA片段
这些DNA片段再被做成2代测序的文库,拿到illumina测序仪上进行测序
测序之后进行生物信息分析,寻找有用的信息
方法验证
在讲下面具体的验证过程之前,我们先说一个CITE-seq引入的概念:ADT
ADT是antibody-derived tags的首字母缩写
它的中文意思是:被测序测到的“从抗体衍生出来的标签”的数量。注意,这里有隐含的数量的概念
可以近似地认为:ADT就是抗体所对应的蛋白在一个细胞表面上的表达量
但要说明,这是一个近似值,因为各种抗体与其抗原的亲和力是不一样的,结合速度也会有差异,所以说被测到的抗体数量代表了被测的目标蛋白的数量的近似值
这张图是把人的细胞,和小鼠的细胞放在一起做CITE-seq实验,用来看CITE-seq能否把人和鼠的细胞给分开
左图是RNA的单细胞测序结果,
右图是ADT的结果
接下来说这些点的意义
绿色的、延着X轴排的点,是人类的细胞
黄色的、延着Y轴排的点,是小鼠的细胞
在中间开阔空间的点,是人类与小鼠的细胞,混合得到的点
整体上,RNA和ADT这两张图的结果有较大程度的一致性
这张图,是把前一张散点图,改成用柱状图来看细胞的比例,这样更能定量地看出把人和鼠的细胞进行分离的效果
左边是RNA的情况,右边是ADT的情况
三种颜色的柱子,
绿色的是人类的细胞数;
黄颜色的是小鼠的细胞数;
蓝色的是混合细胞
我们可以看到混合细胞都是少部分,能分出来的单独的人类细胞或小鼠的细胞是大部分,这说明CITE-seq是可以把细胞给分开的
另外,左边的RNA,和右边的ADT,两边三种颜色的柱子的高度比例是相近的,这说明RNA和ADT之间,在数量上是有较大的一致性
接下来,是用流式细胞仪对CITE-seq的结果做验证,
之所以要做验证,是因为CITE-seq是一个全新的方法,那它得出的结论是否可靠,要用以往的金标准方法进行验证,
那么在CITE-seq方法出现之前,检测单个细胞上蛋白表达量的金标准方法,就是用流式细胞仪方法
流式细胞仪方法是通过检测被荧光抗体染色过的单个细胞的荧光种类和荧光强度,来测定单个细胞上的特定蛋白的表达量的
在把一份细胞分成两部分,一部分上流式细胞仪,另一部分用CITE-seq来检测
在这组图中,
上面一排的图,都是流式细胞仪得到的数据;
下面一排的图,都是CITE-seq得到的ADT数据
我们细看一下
先看第一列的两张图,根据CD3和CD19两种蛋白区分出来的T细胞和B细胞,
流式分出来的T细胞占全部细胞的52%,B细胞占13%;
CITE-seq的ADT分出来的结果,T细胞占52%,B细胞点11%。流式和CITE-seq的结果很相近
再看第二列的两张图,这是根据CD4和CD8a两种蛋白做的区分,
流式分出来的CD4 T细胞占70%,CD8 T细胞占22%;ADT分出来的结果,CD4 T细胞占68%,CD8 T细胞占24%。流式和CITE-seq的结果也还是很相近
第三列和第四列,结果是一样的,流式和ADT的判断结果很相近
再做进一步的验证
CD8这种蛋白,在各个细胞中的表达量有高有低,表达量的分布范围会很大,作者就用CD8作为标志物,来分细胞,表达量从高到低分成4档
同样是用流式和CITE-seq两种方法来做
图E,是按照流式细胞仪测出来的CD8的量,我们看到把细胞按CD8表达量从低到高分成4部分,用4种颜色的峰来表示
图F,是按照CITE-seq的ADT推算出来的CD8的量,把细胞按分成4部分
我们可以看到图E的形状和图F的形状高度相似
这进一步说明CITE-seq得到的ADT数据所代表的目标蛋白的表达量,与流式细胞仪得到的蛋白表达量,有高度的一致性
接着是做mRNA和ADT的对应关系
作者取了脐带血的细胞,用13个抗体做了一个panel,来进行检测。
左图,是把RNA单细胞测序后的细胞,按照RNA表达,做出来的t-SNE图
右边这个图,是在t-SNE图的基础上,把每个细胞表达出来CD3e的表达量标在每个细胞上,表达量越高,则点的颜色越深
上边的图是mRNA的标示结果,
下边的这张图,则是ADT的标示结果
我们可以看到,mRNA图中颜色深的点,ADT图中相应的点的颜色也较深,这说明mRNA值与ADT是有较好的对应关系的
这是把上一张PPT中的展示方法,应用到10种蛋白,得到的结果
我们可以看到,在大多数情况下,mRNA的表达量与ADT的表达量有一致性
但是,并不是所有的基因的表达中, mRNA与ADT的情况都完全一致
以CD11c为例,红框中框住的这部分细胞,mRNA有一定的表达,但是ADT的表达却很低。
而蓝框中框住的这部分细胞,mRNA有一定的表达,但是ADT的表达量很高。
这说明,mRNA和ADT表达的一致性是相对的,而不是绝对的,有些情况下mRNA和ADT的表达会有较大的差距
这是两种蛋白的mRNA和ADT的对照图。
图中都是NK细胞。左边的两张图是CD56,右边的两张图是CD16。上边的两张图是mRNA的结果,下边的两张图是ADT的结果。都是颜色越深,表示表达量越多。
我们看到CD56的mRNA检出量较低,但是它的ADT的量较高。而CD16的mRNA检出量较多,但是它的ADT检出量较少。
这也再次说明,在不同的基因之间,mRNA表达量与最终表达的蛋白的量可能是不一样的。
有趣的发现
作者看到用流式细胞仪来看CD56这个蛋白的荧光,细胞被分成三个峰,强光、淡光,和没有光,三种情况
作者又观察了CD56和CD16的ADT数据在t-SNE图中的分布情况,看到CD56的ADT高的细胞,它们的CD16的ADT就低
接着按照在流式细胞仪中CD56的蛋白的荧光强度的强弱,把细胞分成两组,一组是CD56荧光强的,也就是图中用棕色标出来的细胞;另一组是CD56荧光弱的,也就是绿色的这部分。
然后来看ADT的多少,对于CD56这种蛋白,棕色的这部分是ADT多的,绿色的这部分是ADT少的。这是很好理解的,就是同一种蛋白,流式细胞仪的检测到的荧光强度,与ADT的数量的趋势一致。
但是对于CD16这个蛋白,我们可以看到,情况是相反的,综色标的这部分细胞,CD16的ADT是少的,绿色标的这部分细胞,CD16的ADT是多的。
也就是说,CD56和CD16的蛋白表达量是正好相反的,CD56多的细胞,它表达的CD16蛋白就少;反之CD56表达得少的细胞,它表达的CD16就多。
文章中特别指出了这种现象。这也是可以供进一步研究的一个点。
作者进一步对所有被检测的RNA基因以及panel中的蛋白做分析。
作者还是把细胞按CD56这个蛋白在流式细胞仪中检测到的荧光强度,分成荧光强度强的、和弱的。
横轴表示荧光弱的细胞中,特定基因的表达量;
纵轴表示荧光强的细胞中,特定基因的表达量。
棕色的点,是过去的研究中,已经知道的,会在CD56高表达的细胞中出现的基因;绿色的点,是过去的研究中,已经知道的,会在CD56低表达的细胞中出现的基因。
我们可以看到,除了ICAM3这个基因的表达与预期有差别之外,其它的几个基因都出现在了预期的大方向上
ADT数据还能提升细胞分簇的效果
左边的图是仅用mRNA的数据对细胞进行分簇的结果,
右边是加上了ADT的数据对细胞进行分簇的结果
左图中,光用mRNA的数据,CD8 T和CD4 T的细胞混在一起,分不开,
加上了ADT的数据后,CD8 T的细胞就和CD4 T细胞明显地分开了。
同样CD16 单核细胞与CD14单核细胞,原来是混在一起的,
现在通过加了ADT数据之后,就可以分开了。
这说明ADT对分簇工作是增加了有用的新的信息的
接着作者对Panel中所测的基因的ADT数据,做了两两对比
我们拿比对图的一角来做说明
横座标是CD4的ADT表达量,
纵座标是CD3e基因的表达量
那么如果落在对角线附近的点,就是这两个基因的表达量相近的细胞,
以这团红色的细胞为例来看,它偏离对角线,在纵轴上处于偏上的位置,说明这些细胞中CD3e这个基因的表达量较高;在横轴上处于偏左的位置,说明这些细胞的CD4表达量较少。
这团细胞是红色的,对照到tSNE图,说明这些红色的细胞,主要是CD8T的这个类型的细胞
回到这张两两比较的图,我们看到CITE-seq提供了大量的、内容极丰富的信息,我们可以用多种方法进行数据挖掘
小结
CITE-seq有多项优点
一,CITE-seq同时提供了mRNA和细胞表面蛋白的信息,信息量比传统的RNA单细胞测序更丰富
二、CITE-seq和ADT数据通过和金标准流式细胞仪得出的数据的比对,得到了有效的验证。数据可靠性值得信赖
三、CITE-seq一次可以检测多达100个的蛋白,比流式细胞仪一次能够检测的蛋白种类更多
四、CITE-seq检测出的蛋白信息,是对应到这个细胞的mRNA 信息的,所以这种信息更有用
文章的作者,建了一个网站,网站的名字就叫“CITE-seq”,网站的网址是“www.cite-seq.com”在这个网站上,作者公开了许多有用的资料,例如:作者开发的CITE-seq要用到的软件、实验方法、常见的问题和已发表的文章等
在第八课名师讲堂中,陈巍老师带大家一起解密了:同时检测RNA和细胞表面蛋白的单细胞测序——CITE-seq
小编把大家最关心的重点内容以图文形式展现给大家,如果想观看回放直播课程,扫描下方二维码免费报名!
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy