Engage to Life Energy
文章的题目,是《High-throughput single-cell chromatin accessibility CRISPR screens enable unbiased identification of regulatory networks in cancer》
文章发表在Nature communications杂志的2021年5月刊上。
文章的题目,翻译成中文,意思是《高通量单细胞染色质可及性 CRISPR 筛选能够无偏见地识别癌症中的调节网络》
文章的通讯作者,是William Greenleaf,
他是美国的斯坦福大学,遗传学和应用物理学副教授。
实验内容的第一部分,具有染色质可及性读数的单细胞 CRISPR 扫描
这是做Spear-seq的整体实验流程。
我们把这些步骤拆细了来说。
第1步,用慢病毒感染,把CRISPR干扰的sgRNA传递到细胞中去。
这里的sgRNA,已经预先整合了Nextera的接头,也就是Illumina的Nextera转座酶方法的接头。
这样,可以方便后面的建库、测序
这里,特别说一下要包装进慢病毒的Spear-ATAC sgRNA的结构设计。
图中,上面是传统的sgRNA的设计。
我们可以看到,左边黄颜色的,是U6启动子,这个启动子特别启动sgRNA基因的转录。中间就是sgRNA序列所处的位置。右边是恒定序列。
下面,是作者设计的适合Spear-ATAC的sgRNA的结构设计。
我们可以看到,左边黄色的U6启动子中间,夹了一段Read2接头。这段Read2接头,是将来建库测序要用到的建库接头,并且它是Nextera的文库接头。
同时,这个插入的接头,不会影响U6启动子的功能。
右边,多了一个Read1接头,它是与Read2接头配对的Nextera文库接头,
有了Nextera的Read1和Read2的接头,中间的这段DNA包括sgRNA spacer的这一段,就会被扩增ATAC文库的时候,也会被扩增。
第2步,是把这些细胞用流式细胞进行分选,把MOI低于0.05的细胞去掉,也就是去掉没有被慢病毒感染的细胞,剩下被病毒感染可能性高的细胞
MOI是multiplicity of infection的首字母缩写,指一个细胞被几个病毒所感染
MOI低于0.05也就是这个细胞几乎没有被病毒感染
第3步,进行转座反应,再把细胞核用10x的方法进行微滴包裹,在做微滴包裹的同时,要掺入特异性针对sgRNA的引物
第4步,先是在微滴内对单细胞ATAC文库进行线性扩增。
然后是对sgRNA片段进行指数扩增,
注意右侧的扩增的引物,是从10x微珠上来的,这个引物就带了标识细胞身份的barcode,也就是cell barcode
那么扩增出来的文库sgRNA文库,也就带上了cell barcode
第5步,是用带biotin的扩增引物,
把带sgRNA的片段用扩增方法富集出来
注意,扩增出来的PCR产物会带有biotin标签
接下来,把文库进行测序,把得到的数据进行分析。
这是加与不加primer,单细胞ATAC测序得到的染色质开放位置的对比。
红色是带了primer的情况,深蓝色是不带primer的情况。
我们可以看到,两者几乎完全重叠。
也就是说,加与不加 primer,对测到的染色质开放位置,几乎没有影响
这是加与不加 primer,测序到转录起始位点的富集度的比较。
可以看到,加了 primer 之后,测到的转录起始位点的富集度略高一点。
这是加与不加 primer,测序得到的片段长度比较
可以看到,两者很相近。
这是用与不用生物素富集sgRNA文库,测序得到的片段长度的分布情况。
左边是没有用生物素标签富集的文库,
右边是有经过生物素标签富集的文库。
很显然,两者有很大的差异。
作者计算得出,用生物素进行富集,得到的sgRNA片段,比不用生物素,多了40倍。
接下来,作者设计了9个sgRNA。
这其中,针对GATA1基因的,有3个sgRNA;针对GATA2基因的,有3个sgRNA。
另外,还有3个sgRNA,不针对任何的基因,仅仅用作对照组。
这些sgRNA文库被导入到K562白细胞中,这些细胞都已做了基因工程改造,能够表达CRISPRi dCas9-KRAB基因合盒子,来敲低作者感兴趣的基因。
作者通过测序,捕捉到了6390个细胞核
这其中,有3045个细胞核可以直接与表观遗传学特征联系上。这里说的表观遗传学特征,也就是指sgRNA的结果
这3045个细胞,占到了全部细胞核的48%
图中,就是这3045个细胞核,与对应的sgRNA的关系。
计算平均每个细胞的花费,用Spear-ATAC-seq方法,每个细胞是0.46个美元;相比之下,Fluidigm C1上做Perturb-ATAC,是每个细胞9.8个美元。
比较通量,在10x的芯片,一次可以处理多达8万个细胞,只需要7分钟。而用Fluidigm C1,一次只能处理96个细胞,每次要花4个小时。
因此Spear-seq比Fluidigm的效率更高,成本更低。
这是Spear-ATAC实验得到的细胞UMAP图,再在这上面用三种颜色标示了针对三种目标的sgRNA对应的细胞。
从图中,我们可以清楚地看到,被sgGATA1和sgGATA2,还有不针对特定目标的sgRNA干扰的三种细胞,在UMAP图上被清楚地分开。
这表明sgRNA的分配有高度的特异性。
GATA1和GATA2都参与造血分化和发育。然而,红系转录因子GATA1是K562细胞中的一个必需基因,而GATA2d对K562细胞系的生长和存活是可有可无的。
接着,作者开发了一个框架,用于无偏见地识别包含不同sgRNA的多个细胞群中转录因子基序可有性的变化。
先计算了TF基序可访问性分数,然后减去非靶向sgRNA的TF基序可及性分数,然后,对所有这些TF基序可及性差异分数进行排名。
结果如图所示。
正如预期的那样,对GATA1的敲低,降低了包含GATA基序的峰的可及性。
如预期那样,GATA1的敲低降低了包含GATA基序的峰的可及性,与GATA1的ChIP-seq峰可及性有重叠。
与K562相比,GATA1敲低导致GATA足迹减弱。
GATA1基因座的局部可及性,在敲低后也降低。
这进一步验证了分配给sgGATA1的细胞在该基因座下调表达。
通过在含有sgGATA1的细胞、与表达sgNT的细胞之间,做表达差异分析,观察到14262个峰的可及性增加,14026个峰的可及性降低。
GATA1敲低后,可及性降低的峰富含 GATA 基序,
而 GATA1 敲低后可及性增加的峰富含 SPI/RUNX 基序
GATA1敲低后,可及性降低的基因组区域的GREAT富集因靠近红细胞特异性基因而富集
而 GATA1 敲低后,可及性增加的基因组区域因靠近巨核细胞特异性基因而富集
实验内容的第二部分,使用 Spear-ATAC 随时间评估跨监测扰动
这是做随时间推移的敲除转录因子的动态影响的实验设计。
取样的时间点,设计在敲除实验的第3天、第6天、第9天、和第21天。
针对的基因是6个,每个基因设计3个sgRNA,
这样是18个sgRNA。再设计3个惰性sgRNA,一共是21个sgRNA
这是4个时间点的sgRNA扰动后的TF基因可及性变化排名
可及性变化的峰值随着时间的推移而变化。
这是每个 scATAC-seq 亚群的染色质峰可及性热图
在GATA1敲低后第3天,富含 STAT5 基序的峰的可访问性增加,但在第 6 天和第 9 天恢复到接近基线的可访问性水平
STAT5 已知参与 GATA1 依赖过程中红细胞分化的维持;因此,在第 6 天和第 9 天,含有 STAT5 基序的峰的可及性降低,随后含有 SPI 基序的峰的可及性增加,这可能进一步表明向更多巨核细胞谱系的转变。
实验内容的第三部分,使用 Spear-ATAC 的高通量扰动筛选
这是作者为了验证Spear-seq的高通量,而设计的实验方案。
针对36个转录因子,对每个转录因子基因做2-3个sgRNA
再加上12个sgRNA针对必要基因,14个不针对特定目标的sgRNA作为对照。
被转染的细胞,有三种,分别是K562、MCF7、和GM12878
实验总共得到32,832个细胞核。
平均每个sgRNA有372个细胞。
这是用chromVAR对三种细胞,经过扰动后的基序可访问性变化的排序。
再次确定了顶级的sgRNA:TF的关系。
例如:sgGATA1:GATA的对应关系,以及sgKLF:KLF的关系
类似地,导致强烈基序可及性差异的 sgRNA 基因型,所鉴定的基序与靶向转录因子一致,如 GATA1、NFE2、KLF1、FOSL1 和 NRF1
为了建立 TF 之间的调节关系,作者测量了 TF 扰动对共变调节网络的影响,方法如图所示
为了识别这些扰动的共变网络,作者通过靶向细胞减去非靶向细胞内的 TF-TF 基序可及性相关性
分析了最强目标扰动 sgGATA1 的这些关系。作者确定了五个受 GATA1 敲低影响的 TF 基序模块
从这个分析中,作者再次发现 GATA1 的消耗导致模块 1 的协调活动增加,模块 1 由关键的造血 TF 组成,如 SPI1、IRF1等
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy