Engage to Life Energy
课程简介
MIX-Seq是一种使用单细胞RNA测序数据的基于SNP的计算多路复用方法,用于对具有单细胞分辨率的样品混合物进行扰动后反应的多路转录谱分析。MIX-Seq可用于分析对100个或更多癌细胞系池中化学或遗传扰动的响应,可揭示共享的和在特定环境中的转录反应成分,这些成分可以识别药物的作用机理,并能够预测从短期转录反应到治疗的长期细胞生存力。
在上次直播课中,“陈巍学基因”创始人陈巍老师为大家解读《多重单细胞转录反应谱分析,定义癌细胞的药物敏感性和确定药物治疗作用机制》,小编把直播课内容整理成图文分享给大家,大家也可以扫描下方二维码免费观看回放视频!
文章概况
文章的题目是:《Multiplexed single-cell transcriptional response profiling to define cancer vulnerabilities and therapeutic mechanism of action》,这篇文章发表在2020年8月27日出版的nature communications杂志上
文章的题目翻译成中文,意思就是《多重单细胞转录反应谱分析,定义癌症对药物的敏感性和治疗作用机制》
文章的通讯作者是Andrew J. Aguirre博士, Aguirre博士是Dana-Farber癌症研究所、哈佛大学和MIT广泛研究所的医学肿瘤学的科学家和医师
实验方法
作者要研究的,是通过药物、或者基因的扰动,来看细胞的转录表型变化、和增殖率变化。
过去,对基因表达的全谱扫描,并不能够对多细胞系环境中,对给定的扰动进行有效的全谱扫描分析。
所以,作者开发了称为MIX-seq的分析方法, MIX-seq是Multiplexed Interrogation of gene eXpression through single cell RNA Sequencing的首字母缩写。
这是一种基于细胞系的SNP信息,做单细胞RNA测序的多路复用方法。它是对多个混合培养的细胞系,做扰动反应,然后做单细胞分辨率的多重转录谱分析。
这里分辨每个细胞是来自于哪个细胞系,主要是基于每个细胞系的已知特征SNP信息,来区分每个细胞属于哪个细胞系
实验表明MIX-seq分析可以对100个细胞系、或者更多细胞系的混合细胞池进行分析,检测化学扰动或遗传扰动的效果。
结果分析解读
第3.1部分,单细胞RNA-seq结果的SNP拆分
实验过程中,先把多种癌细胞系的细胞放在一起进行混合培养
然后,进行扰动反应,扰动反应分两类,
一种是加入某种化合物,看细胞的反应,
第二种是加入sgRNA进行转染和基因扰动,看细胞的的反应。
细胞经过扰动后,用单细胞测序方法,得到大量的序列数据。
把这些序列与每个细胞系已知的SNP位点进行对比,就可以知道哪些序列来自于哪个细胞系。
这张图是用SNP位点来区分细胞系的效果。
SNP还能很好地帮助区分双细胞,和低质量数据。
双细胞就是指10x产生油包水小液滴的时候,两个细胞被包进了同一个小液滴的这种情况。
从图中,我们可清楚地看到,
红色的点是双细胞,
蓝色的点是单细胞,
绿色的点是低质量的,
三者分得很开,可以进行轻松的区分。
第3.2部分,MIX-Seq识别选择性扰动响应和药物作用机制
作者拿13种化合物来处理混合细胞系。
Nutlin是13种化合物中的一个代表
Nutlin是一种选择性的MDM2抑制剂
而MDM2是TP53信号通路里的重要组成部分
用Nutlin来处理细胞,就是看对TP53信号通路会有什么影响
左图是24种细胞被Nutlin处理后的UMAP图。
深红色的点是Nutlin处理的结果,
灰色的点是DMSO处理的结果,DMSO处理的组也就是对照组。
我们可以看到,有些细胞群的位置发生了较大的偏移,
如红色的这个楕圆里的这个细胞群。
这个箭头显示了Nutlin处理导致的RNA表达变化
把这些细胞群的RNA表达变化用矩阵展开来看。
这是放大了的矩阵图。
图的横向,列的是一个个被关注的基因
纵向,列的是24个细胞系
格子中的颜色,表示的是基因表达的改变情况。红色是上调,蓝色是下调,黄色是不变。
细胞系,上面的6个细胞系的TP53基因是野生型的,
下面的18个细胞系的TP53基因是突变型的。
我们可以清楚地看到,上面6个TP53野生型的细胞系,基因表达有较大的变化,或变蓝,或变红。
下面18个细胞系基因表达没有明显的变化,格子依然是黄颜色。
也就是说,TP53基因野生型的细胞系,对Nutlin的处理表现出了强烈的反应。
而TP53基因突变型的细胞系,对Nutlin的处理没有什么大的反应。
这与Nutlin是MDM2的特异性抑制剂,而MDM2是TP53信号通路的重要组成部件,是一致的。
这是TP53野生型与突变型细胞系的表达火山图
左为是野生型的,右边是突变型的。
我们可以看到,左图TP53野生型的细胞中有大量的基因是有显著的表达量变化的,也就是这些红色的点
而在右图,绝大多数的基因都没有显著的表达量变化。
这说明了TP53野生型的细胞被Nutlin处理后,大量基因的表达量发生了很大的改变。
而TP53突变型的细胞的表达量变化很小。
对TP53野生型细胞系中上调与下调的通路进行富集
我们可以看到TP53下游途径中的基因表达明显上调,
而细胞周期过程的基因表达明显下调
作者用13种药物对细胞进行了处理
其中,当用蛋白酶体抑制剂硼替佐米处理后,引起蛋白质折叠和热休克反应途径的基因强烈上调
用化疗药物吉西他滨处理细胞后,改变了细胞的凋亡相关基因的表达
依维莫司是mTOR信号通路的抑制剂,
依维莫司处理后,mTOR信号通路的基因表达强烈下调
MIX-seq除了可以用于化学药剂的扰动检测,作者还把它用于基因扰动效果的检测
作者把谷胱甘肽过氧化物酶4,也就是GPX4,作为目标基因,GPX4有保护细胞膜不受氧化的作用
作者把两个GPX4酶的sgRNA,和两个对照的sgRNA引入50个细胞系中,然后做单细胞RNA-seq
左边两个是对照组sgRNA处理后,GPX4表达结果,我们可以看到GPX4基因的表达依然较高
右边两个是两个针对GPX4的sgRNA转染后,GPX4基因的表达结果。可以看到,经过针对性的sgRNA转染后,GPX4的表达量是明显下降了
这是GPX4基因被敲掉后,各基因的表达情况。
看GPX4的这个红点,一方面这个红点很偏左,说明表达量明显下降,另一方面这个红点很靠上,说明表达量减少的程度很明显。
可以看到EEF1A2这个基因的表达调高。而EEF1A2是一个调节脂类代谢的基因。而GTX4基因是保护细胞膜,也就是脂类不受氧化影响的
这是对GPX4基因被敲除后,各通路的基因表达变化的图
其中N-Glycan,也就是N-聚糖合成的这个通路的基因表达量大幅上升
而这些通路都是调节谷胱甘肽的水平的。
第3.3部分,对与细胞生存能力相关的响应特征进行分析
MIX-seq有对一大堆的细胞的表达反应进行扫描的能力,那这种能力带来一个好处,就是可以区分出一种药物对细胞的生存能力的影响效果
图中,就是用曲美替尼处理99个细胞系的混合细胞池,得到的结果,
灰色的是对照组DMSO的结果,
红色的是曲美替尼处理的结果。
我们可以看到有每个细胞群都相对于对照组的位置,有一定的位移
作者把每个基因的表达变化为两个分量:
LFC = β 0 + β1 * 敏感度
公式左边,LFC,是log fold change的意思,是指数倍的变化
公式右边,与生存无关的响应分量,标记为β 0,它表征完全不敏感的细胞系的响应
另一个是与生存相关的响应分量,标记为β1,表征敏感和不敏感细胞系之间的差异
经过分析发现,β0,也就是对曲美替尼生存能力反应无关的基因,
包括了MAPK信号基因,如:EGR1、ETV4/5、DUSP4/5/6、和SPRY2/4、
下调KRAS信号通路,和肿瘤坏死因子alpha,
和上调干扰素相关的基因,这和之前的报告是一致的
相反,β1,也就是与生存能力相关的部分,
有大量的细胞周期基因,而且显示出强烈的下调,提示选择性细胞周期停滞是与曲美替尼处理下细胞的长期生存作用相关。
把这种分析应用到多个化合物,都用MIX-seq方法来找出生存效应相关的基因,
上面这张图,就是1000个基因对9个选择性化合物的反应
中间这张图,就是1000个基因对4个细胞毒性化合物的反应
下面这张图,是作者发现了几个核 心的与生存相关反应有关的成份,而且这些成份在各化合物之间是共享的。
这些相关成份大量地在细胞周期的基因中富集,
对各种化合物引起的转录组变化,做两两比较。
格子越红,相关程度越高,无色是不相关,绿色是负相关
可以看到只有两个化合物是与别的化合物不相关的,这两个化合物是AZD5591,和Navitoclax。
其余的各种化合物的交叉格子都呈现出一定程度的红色,也就是说都有一定程度的相关性。
navitoclax和AZD5591,是两种抗凋亡蛋白的抑制剂,在所测试的化合物中是独特的,尽管它们引起强烈的选择性生存力响应,但它们没有表现出强的转录反应特征
为了确定使用不同的细胞系的数量会如何影响对转录响应部分的估算,作者做了一个减少细胞系数量的分析。
分析的结果是,细胞系的数量至少要达到5~10个细胞系以上,估算存活相关和非存活相关的结论才会变得较为鲁棒。
第3.4部分,从MIX-seq扫描谱来预期长期存活性
MIX-seq的能够在许多细胞系中有效扫描转录反应的能力,让作者能够测试训练模型,看是否能够从细胞的短期的转录反应来预测一个药物对长期生存的影响。
作者考虑这种方法,在临床上可以用作对治疗效果的预测,例如:对病人的细胞进行短期培养,直接看转录反应的扫描结果,就可以对治疗效果做出预测。
为了测试这一点,作者用随机森林模型,使用对保留的测试细胞系的预测R2来评估其准确性。也就是十倍交叉验证方法。
这个模型精确地预计了几乎所有的细胞系、所有的有选择性杀伤药物的处理效果
对于几种药物,这个模型可以在药物处理后的6个小时,就可以从转录变化预判出生存响应。
黄颜色的点是处理6小时的情况,蓝颜色的点是处理24小时的情况。我们看到,用红线标出来的这4个药物,处理24小时的效果就是处理6小时效果的向上平移
有两个药物是例外,AZD5591和navitoclax。上文我们提到过,这两个药物是两个凋亡引导剂,
进一步看,
这些基因的转录最多是归结于NFKB、TP53和凋亡的信号的上调,
连带了细胞周期、MYC信号、和翻译的下调。
这与之前的生存相关的特征是一致的。
合在一起,这些结果提示,处理之后的转录特征可以提供一个鲁棒的细胞对药物反应的信号,并且可以应用于它们的长期生存效应的预测。
对多个细胞系用大的Panel做转录扫描,能够确定各种药物反应的底层的因素,而无需先验的关于基因组和分子特征是如何驱动这些差异的知识。
作为一种简单的展示,作者用PCA,也就是关键成份分析,来对曲美替尼(trametinib)处理后24小时的情况进测检测,把检测到的信息做成的各个基因的响应与各细胞系关系的矩阵。
矩阵中的横轴是排列的基因,
纵轴是细胞系
矩阵中点的颜色是表达的倍数变化
这是关键成份谱,取其中的第一个关键成份,和第二个关键成份做进一步分析
第一个关键成份PC1,抓住了曲美替尼(trametinib)在不同细胞系之间的敏感度的差异,
我们可以看到,有BRAF突变的细胞系,也就是粉红色的点子,绝大问部分都在图的最右上方,也就是敏感性最高,同时第一关键成份的得分最高
有KRAS突变的细胞系,也就是绿点子,处在偏右上方的位置,也就是敏感性较高,同时第一关键成份的得分较高
其它细胞系,也就是蓝色的点,则处于图片中间偏左下的位置。也就是敏感性较低,并且第一关键成份的得分也较低
右上方有一片,以有BRAF突变的黑色素细胞瘤居多,并且高表达SOX10基因。
其它的点大多数集中在左下方,第二关键成份的得分低,同时SOX10的基因表达也低。
13个药物中的9个,PC1或者PC2的转录反应矩阵是与细胞系的测量药物敏感性相关的,而且FDR<0.1。这提示这里经常有一种主导的反应差异性预先就存在。
最后,为了以非监督的方式来找出,一种跨各种细胞系、化合物,和时间点的全通用的模式,作者创建了一个2维的,用混合扰动反应来扫描的UMAP图。
成组的反应,与相关的扰动,它们之间的关系是明显的。
例如:同一种药物表达谱,不同的时间点,在UMAP图中是相近的。
功能相近的药物,
如taselisib(PIK3CA抑制剂)和everolimus(MTOR抑制剂)聚在一起,
同样trametinib(MEK抑制剂)和afatinib(EGFR抑制剂)聚在一起。
有趣的是,BRAF突变的细胞系对BRAF抑制剂dabrafenib的反应与trametinib在一起,而不是与其它的dabrafenib反应在一起。
第3.5部分,以单细胞的分辨率发现异质反应
单细胞RNA-seq是一种有效地进行许多细胞系的多通路复用的转录扫描谱工具,它能够以单细胞的分辨率做更加精细的分析。
并且它对转录谱的分析是全面的。
比如,这张图是用Nutlin处理多个细胞系的结果。
图中蓝色的细胞,就是药物处理后,被滞留在G0/G1期的细胞
这张图,是从各细胞系的TP53基因的基因型,来看nutlin处理后,哪些细胞系会有大量的细胞被滞留在G0/G1期
我们看到,红色的点是野生型的TP53的细胞系,这些细胞有相当比例被滞留在G0/G1期;
而黑色的点,也就是TP53突变型的细胞系,这些细胞系中只有很少比例的细胞被滞留在G0/G1期。
接下来,作者系统性地评估了每种化合物在细胞周期上的效果。
在处理后的24小时,大多数药物产生了在G0/G1之间的细胞,也就是图中这些蓝色的向上的柱子,13个细胞系中的10个细胞系有这个效果,伴随的是处于S期和G2/M期的细胞减少,13个细胞系中9个有这个效果。
两个值得注意的例外是:
吉西他滨(gemcitabine),和普瑞沙替尼(prexasertib).
吉西他滨(gemcitabine),是DNA破坏剂,它(Gemcitabine)减少处于G2/M期的细胞,并增加处于S期的细胞,这与它的已知作用是触发CHEK-1介导的S期捕获是一致的。
普瑞沙替尼(prexasertib)是CHEK1/2抑制剂,它(Prexasertib)减少了S期细胞的比例,并稍微增加了G2 / M期的细胞比例,这与抑制CHEK1介导的DNA损伤检查点,从而导致细胞在整个细胞周期中的进程失调是一致的
与大量细胞表达谱分析不同,单细胞RNA-seq还可以搞清细胞群中异质反应的特点。例如,硼替佐米的治疗对混合的24种细胞系中的10种细胞引起了双峰反应。
我们来看这张图,
图中小的圆圈,是DMSO处理的效果,在UMAP图中,DMSO处理的细胞,都集中在图的左下方
图中大的圆圈,是硼替佐米处理的细胞,我们看到,硼替佐米处理的细胞分成了两大部分,
一部分集中在上面,
另一部分集中在右下角
集中在上面的这些细胞都是处于是G0/G1期的
集中在右下角的这些细胞是以S期的为主,还混有一些别的期的细胞
这就是硼替佐米处理的双峰反应,把细胞分成了两个亚群,一个亚群集中在G0/G1期,另一个亚群集中在S期
与大量细胞表达谱分析不同,单细胞RNA-seq还可以搞清细胞群中异质反应的特点。例如,硼替佐米的治疗对混合的24种细胞系中的10种细胞引起了双峰反应。
我们来看这张图,
图中小的圆圈,是DMSO处理的效果,在UMAP图中,DMSO处理的细胞,都集中在图的左下方
图中大的圆圈,是硼替佐米处理的细胞,我们看到,硼替佐米处理的细胞分成了两大部分,
一部分集中在上面,
另一部分集中在右下角
集中在上面的这些细胞都是处于是G0/G1期的
集中在右下角的这些细胞是以S期的为主,还混有一些别的期的细胞
这就是硼替佐米处理的双峰反应,把细胞分成了两个亚群,一个亚群集中在G0/G1期,另一个亚群集中在S期
这是把细胞差异的火山图放大了的情况。
图中,把处于S期的细胞的特征基因用红颜色标示了出来
这是用单细胞测序能够清楚地看到各细胞亚群的表达差异的一个实例
第3.6部分,药物处理后各时间点的多重分析
接下来,作者做了多个时间点、多个细胞系的双重复用的单细胞测序
具体来说,
就是用连有寡核苷酸标签链的抗体,结合到细胞表面上,给每一种实验条件的细胞加上特定的细胞标签。
再加上MIX-seq用自然的SNP标签来对不同的细胞系做多重复用,就达成了在多个时间点、多个细胞系的双重复用
接下来,作者应用统计模型来量化曲美替尼反应的生存能力相关和非生存能力相关的各个部分,随时间演变各个基因的表达情况,并整合到所有细胞系中去.
图中,上面两个图是处理后EGR1基因的表达变化情况,左边是对曲美替尼不敏感的细胞系TEN,右边是对曲美替尼敏感的细胞系RCM1,
我们可以看到处理后3个小时,两个细胞系的EGR1基因的表达都明显下调。而EGR1基因是MAPK信号通路的下游早期响应基因,而曲美替尼就是MAPK信号通路的抑制剂
下面两个图是MCM7这个基因,在各个处理时间,表达变化的情况。
我们可以看到,左边对曲美替尼不敏感的TEN细胞系中,MCM7没什么变化。
右边,对曲美替尼敏感的RCM1细胞系中,MCM7随时间延长,表达逐步降低
在与生存无关的应答中,下调的基因显示出一系列时间模式,
其中有几种基因,例如EGR1和DUSP6,在处理后3小时达到最大下调
相比之下,与生存相关的反应出现的时间要晚得多,
只有ESCO2、NCAPG和CLSPN等基因在治疗后12–24小时,在敏感细胞系中会有选择性下调
小结
这篇文章,
首先,是构建了一个检测平台,这个检测平台利用SNP基因型,能对多个细胞系、多样本进行高通单细胞RNA-seq检测分析
有了平台之后,可以衍生出多种用途,最直接的,
是可以同时对多个细胞系生存响应、表达改变进行检测分析
可以用药物处理后细胞短期生存响应,来预期药物处理后细胞长期生存情况
并且可以用单细胞的分辨率发现异质反应
进一步的拓展,可以把这个平台技术拓展到多时间点、多样本的分析
未来可以考虑应用到临床上,对多种药物的治疗效果做预判
作者再进一步进行了拓展,将MIX-seq方法与细胞标签结合使用,以进一步复用其他实验条件,例如治疗后的时间点或药物剂量,以减少建库成本,增加有效信息的产出。
图中横轴是排的一个一个的细胞
纵轴排的是一个一个的细胞系
颜色表示被测检到的细胞中的SNP与细胞系已知的SNP信息的一致性。颜色越偏蓝,则一致性越高。
我们可以清楚地看到,所有的细胞都有一个单一的深蓝位置。也就是说,可以很清楚无误地把细胞归类到它应该属于的那个细胞系。
第二个关键成份,与SOX10基因的表达高度相关,我们可以看到点的分布
利用这一点,作者测量了一个24个细胞系的混合池,用曲美替尼(trametinib) 处理这个混合细胞池,做了5个处理时间点,从处理后的3小时到处理后的48小时。用细胞标签来对各种实验条件得到的样本做多重复用。
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy