dafabet手机黄金版_dafabet黄金手机版

晶诚所至生命所能

Engage to Life Energy

上课笔记|通过直接引导 RNA 捕获和靶向测序进行组合单细胞 CRISPR 筛选

发布日期：2021-07-16浏览：次

文章概要

文章的题目，是《Combinatorial single-cell CRISPR screens by direct guide RNA capture and targeted sequencing》

这篇文章发表在Nature Biotechnology杂志的2020年8月刊上。

文章的题目，翻译成中文，意思是《通过直接引导 RNA 捕获和靶向测序进行组合单细胞 CRISPR 筛选》

文章的通讯作者，是美国加州大学旧金山分校，细胞与分子药理学系的Jonathan S. Weissman教授

研究背景

实验结果分析

实验内容的第一部分，修改引导恒定区以实现直接捕获 sgRNA序列

作者设计了5’端捕获、和3’端捕获sgRNA，这样两种捕获方法

我们接下来分别讲这两种捕获方法

先说5’端的mRNA建库的原理图。这个过程，也就是10x Genomics公司的5’端建库的方法。

用这个方法得到文库，作用是对单个细胞的RNA表达进行分析。

在5’端的建库方案中，对sgRNA的捕获方法，是如图所示。

对sgRNA后面的序列中的恒定序列，设计逆转录的引物。

这个引物加入到逆转录过程中，合成出带sgRNA序列的cDNA。

这个cDNA再和其它的mRNA的cDNA一起，与凝胶微珠上的TSO序列结合，连上CBC序列。CBC是cell barcode，细胞条形码的缩写，这样达到识别单个细胞的目的。

这是3’端的对mRNA进行建库的原理图。

这个过程是和10x Genomics公司的3’RNA建库原理是一致的。同样，这个方法是得到单细胞的表达文库

这是在3’端建库中，对sgRNA的捕获。

凝胶珠子上有针对sgRNA后面跟着的恒定区域中的特定序列的引物。

这个引物吸附到特定序列后，在逆转录酶的作用下，合成出cDNA，

然后，再接上TSO序列。然后，就是可以PCR扩增，再建库测序了

这张图中，黄颜色的部分是sgRNA序列，

后面跟着的蓝颜色的序列，是sgRNA中的恒定区域。恒定区的英文叫constant region,首字母缩写是CR，我们后面会用CR区来指称这个恒定区。

这里的CR区，要起到两个作用，第一个作用是与Cas9的酶结合，然后Cas9酶在sgRNA序列的引导下，对基因组中的目标位置进行编辑。

第二个作用，是要插入一段序列，这段序列可以给捕获有一个恒定的序列，以便与捕获用的引物序列相互识别，并启动逆转录。

同时这个CR序列还要不破坏原来的基因编辑功能。

作者在CR区中找了两个位置，来尝试插入捕获序列。捕获序列就是capture sequence，首字母是CS。后面我们会用CS来指称这个插入的捕获序列。

作者先在右边的这个茎环的位置设计一个CS序列，叫CS1。

作者选的第二个位置，是在3’端的末端设计一个CS序列，叫CS2.

接着，就是对CS1和CS2在表达GFP荧光蛋白的细胞上进行测试。

测试CS序列对编辑效率的影响。

这里，细胞中原来的GFP蛋白会发出荧光，如果经过针对GFP的sgRNA引导的基因编辑发生了，产生抑制作用，GFP蛋白就不发光了。

那么就可以用检测荧光强度变化的这种方式来看基因编辑的效率。荧光强度则是用流式细胞仪来检测。

图中，横轴是备选的22个CS序列，插入不同的位置。

纵轴是被转染的细胞的荧光强度比没有被转染的细胞的荧光强度，高度越低，说明转染后的抑制效果越强。

图中间的柱子群，分三组，最左边浅灰色的柱子群，是CS序列的插入位置在茎环中的，

中间中等灰色的柱子群，是CS序列的插入位置在3’端的。

最右边黑色的柱子，是对照组的结果。

CS1序列在茎环位置有较好的抑制作用

CS2序列在3’端的位置有较好的抑制作用

CS1和CS2被选中，用在下面的实验中

这是插入了CS1或CS2的sgRNA序列，与阳性对照组的sgRNA序列，比较它们基因编辑对荧光的抑制效率

从实验的结果看，有插入CS1和CS2的荧光曲线,和阳性对照组的sgRNA的荧光曲线，是几乎重合的。这说明插入CS1序列和CS2序列，对sgRNA的基因编辑效率几乎没有影响。

这张图里，紫红色的曲线是把CS1放在3’末端，可以看到紫色线的峰更偏右，也就是CS1放在3’端的位置，它的基因编辑效率是下降的。

所以，作者不建议把CS1序列放在3’末端。

接下来，用直接的建库测序来，验证各个方案。这是建库测序的方案。

注意一下，这里会对文库用固相吸附，进行一次按文库的大小进行的分头富集。

上清液是DNA长度小于500BP的片段，用于sgRNA和CBC+UMI的建库测序。主要是得到sgRNA与CBC的配对信息，CBC是细胞的barcode。

洗脱液，是DNA长度大于500BP的片段，用于GBC和CBC+UMI的建库测序，主要是得到单细胞的基因表达数据，以及GBC方法中的sgRNA的对应barocde序列。

实验内容的第二部分，通过直接捕获sgRNA进行测序的这个方法是稳健的，并且捕获效果与GBC捕获的索引的效果相当

把5’端和3’端两种捕获方式，以及CS1和CS2，排列组合，得到四个平台方案，

再加GBC作为阳性对照，来看建库测序的情况。

这里横轴是5种文库，纵轴是每个细胞的UMI数。

可以看到，后三组，UMI数都高于GBC的方案，

而只有3’端配CS2的方案，得到的每个细胞的UMI数是少于GBC方案的。

作者接着对每个细胞有多少UMI做了一单轴的Log图。

我们可以看到，这张图呈现出两个端，右边的峰是每个细胞有较多的UMI，而左边的峰是每个细胞只有少数的UMI，但这些细胞点比很高。

作者认为左边这些峰中的不是真的细胞，而是PCR或其它过程引入的杂信号，因此，作者只保留右边的这些细胞作为有效数据，把左边这些细胞都舍弃。

这是5个平台中针对32个基因的sgRNA的UMI数。

我们可以注意到NegCtrl2这个基因的UMI数是特别低的，作者的解释是这个sgRNA针对的序列是一个有连续的G碱基的序列，这段序列可能是较难以被基因编辑的序列。

实验内容的第三部分，直接捕获 Perturb-seq 在表型分析方面的性能与 GBC Perturb-seq 相当

作者再深一步的分析，发现sgRNA序列5’端头部的2个碱基会影响UMI数。

图中，列出了5’和3’的末端2个碱基的序列，会引起UMI数的变化。

这是把GBC、3’和5’，三种方法基因编辑后，细胞的RNA表达情况做比较。

三大块，分别是三种基因编辑方法。每个图中的横轴和纵轴，则是30基因。

每个小格子的颜色，则是纵横两条轴的基因分别被编辑后，发生的RNA表达变化的一致性。

我们可以看到，三种方法产生的图的颜色深浅的分布是高度一致的。

这也就是说，三种方法做的基因编辑，产生的RNA表达改变是高度相似的。

这是5个平台上，30个目标基因被敲低后的表达水平。可以看到，这些目标基因被敲低后，在各个平台上的表达水平是相近的。

这张图

左边是100个表达差异最大的基因，在GBC平台与5’平台上的表达差异。

右边是这100个基因，在GBC平台与3’平台上的表达差异。

可以看到两者的差异都不大。

这个结果证实，新方法可以精确地导向到要做基因编辑目标基因，同时也不会全局性地改变细胞的表达谱。

这是三个平台的基因编辑对基因表达的调控，落入三个模块，而且高度相似。

这是用t-SNE图来展示三个平台上被基因编辑的细胞的情况，可以看到，三个平台上的细胞展示出很高的相似性。

用点阵图来展示GBC和3’或5’编辑的一致性

我们可以看到，大多数的点，都位于对角线的两侧，也就是说GBC和3’或5’编辑的一致性较好。

实验内容的第四部分，直接捕获 Perturb-seq 允许在具有 CRISPR 切割的 iPSC 中稳健地进行稳健的sgRNA序列测序和表型分析

接着，作者为了验证直接捕获 sgRNA 方法的实用性，在 iPSC 细胞中做干扰实验。

用40个sgRNA做实验。

这里，上图显示了测序得到的转录数据。下图展示了这40个 sgRNA 在每个细胞中得到的UMI数。

这是细胞被干扰后，基因表达的变化。

这里横轴是被干扰后，表达变化最大的这些个基因，纵座标是被针对的基因

这张图，左边是比较针对不同的基因的sgRNA的干扰，它们引起的基因表达变化的相似性

右图针对相同的基因的不同的sgRNA，他们引起的基因表达的变化的相似性。

我们可以看到右边的相似性是比左边的相似性高的，也就是说针对相同基因的sgRNA，它们引起的基因表达的变化，更加相似。

实验内容的第五部分，增加第二个的 sgRNA 恒定区，以实现双 sgRNA 的 3' 直接捕获 Perturb-seq

接下来，作者做针对一个质粒里有针对两个基因的sgRNA干扰载体。

这样做了针对92个sgRNA对，针对41个基因，有81个基因对。

注意，这个载体上有BFP蛋白的基因，BFP是一种能发出蓝色荧光的蛋白，这里是作为载体被转染进细胞的一个标志基因。后面还会提到这个基因。

这是干扰实验测序后，得到的CR3CS1和CR2CS2两种序列的UMI数，都有一定量的UMI数。并且前者的UMI数更高。

比较载体中A位置和B位置的sgRNA分别得到的UMI数，

可以看到A位置得到的UMI数明显更高

这张图，是看有BFP荧光的细胞中，被检测到的sgRNA的种类数量。

有发出BFP荧光，就是已经被转染的细胞。

这里的柱子的颜色，颜色最深的是有1种sgRNA，颜色淡一些的是有2种sgRNA，颜色最淡的是有3种sgRNA。

我们可以看到，大多数的被转染的细胞，是表达两种sgRNA.

接着，作者针对胆固醇合成途径的几个酶基因，分别做干扰，看相应的细胞周期的变化。

左图，是胆固醇合成途径的图。

右图，是被干扰的基因，和若干个指标之间的关系。

图中，从左到右分别是，胆固醇得分，相对的细胞占比，HUS1的遗传干扰的得分。这个得分计算HUS1基因的表达受干扰后，细胞生长会因此改变的一个分值。

纵向排列的是被干扰的各个基因。

每个格子的颜色，则表示了相应的得分。

我们可以看到，干扰了胆固醇合成前几个步骤的酶，会引起反馈性的胆固醇合成基因的表达上调。

第二，胆固醇合成的中间几个基因，包括：FDPS、MVD、和IDI1，是和DNA修复基因形成合成致死作用。压制这几个酶，会让细胞停滞在S期。

值得注意的是，在合成胆固醇中间步骤的毒性，而不是去除掉胆固醇本身，就可以导致细胞停滞在S期。

这里，是对PMVK和FDPS做敲低的实验，观察引起其他基因表达改变的情况

第一行当PMCK被抑制时，我们可以看到最左边的几个基因高表达。

第二行当FPDS被抑制时，偏左的几个基因有高表达，右边的几个基因低表达。

第三行，是当PMVK和FDPS同时被抑制时的基因表，基因的表达情况更接近PMVK单独被抑制时的情况。而FDPS的影响作用很少。

第四行显示了把第一行和第二行的结果线性叠加的结果。

第五行则显示了实际的第三行的情况与线性计算的第四行的结果的差异。我们看到差异较大。

这显示了一个sgRNA载体中同时有2个不同的sgRNA的意义。它可以用来展示多个基因同时被基因编辑后的复合的基因干扰作用。

这张图，是抑制胆固醇合成途径中的基因，让细胞在特定的细胞周期停滞的情况。

图中，最左边是空白对照组，右边的三组是特定基因被抑制后的情况。

5种颜色的柱子，代表了细胞周期的5个阶段。

当 HUS1 受到抑制单独导致一定程度的细胞周期畸变，

当HUS1和 FDPS 同时被敲低，可以观察到细胞会实质性绕过S 期检查点，并且细胞会在在 G2/M 期中积累。

这再一次展示了一个载体中有2个sgRNA或多个sgRNA可以用来展示2个或多个基因同时被基因编辑之后的复合的基因干扰作用。

作者发现，对HUS1和FDPS这两个基因进行扰动，当一个细胞同时有这两个扰动时，会产生新的形态表型。

这张图里面，横轴排列的是扰动前后，表达变化最大的50个基因。颜色表示扰动后基因表达改变的情况

纵轴排列的，第一行是单独HUS1被扰动的情况，

第二行是单独FDPS被扰动的情况，

第三行是这两个基因都被扰动的情况

第四行是把第1行、和第2行的扰动情况进行线性叠加的结果

第五行是实际的情况，也就是第三行的情况，与线性叠加的情况的差异。

第五行的颜色说明，当HUS1和FDPS同时被敲低，会产生额外的协同效应

在单细胞水平，这产生G2 / M停滞的细胞群，与明显降低总mRNA含量，可能代表垂死的细胞。

基于此，作者提出了一个更新的模型，其中这些细胞中的合成致死率，是由于细胞中HUS1 耗尽的对复制的压力，从而导致细胞周期进程不顺，和无法处理DNA损伤导致有丝分裂灾难。

从广义上讲，这个例子突出显示了高分辨率、单细胞表型对遗传干扰的机械解剖的力量，并展示了如何使用直接捕获CRISPR干扰的结果，以全面、无偏见的方式理解遗传干扰，而无需特定假设。

接着，作者测试一个细胞受多个sgRNA影响的效果。

图中，是用87个抑制sgRNA来转染，横轴是细胞受到一个sgRNA加一个对照干扰后目标基因表达的效果，纵轴是细胞受两个sgRNA干扰后目标基因表达的效果。

可以看到，绝大多数的点，都处在对角线的下方，也就是受双干扰后，目标基因的表达更低。

这张图中，横轴排列的分别是

单个sgRNA敲低

2个sgRNA协同的敲低

和两个sgRNA分别敲低，取敲低中的低值

纵轴则是敲低后的目标基因的表达量。

我们可以看到，2个sgRNA协同敲低的结果，比单个sgRNA的敲低结果更低，也比两个sgRNA分别敲低后的低值更低。

也就是说，2个sgRNA一起做敲低，效果是大于单个sgRNA的效果的。

作者又做了细胞受2个激活性的sgRNA转染的效果，和受一个激活性sgRNA转染的效果。

我们可以看到，大多数的点都在对角线的上方，也就是双个激活性的sgRNA转染后，目标基因的表达是高于单个sgRNA的激活效果的。

实验内容的第6部分，目标富集的基因表达文库的结果与未富集的RNA表达文库的结果密切相关

传统的全转录组测序，2%的基因的表达，占据了50%的测序通量。

也就是说传统的RNA-seq测序，数据有很大的偏向性，对检测低表达的基因是不友好的。

为此，作者设计了对建成的表达文库中的目标基因群的杂交富集步骤，在富集之后，再进行高通量测序。

作者设定的目标基因群含978个目标基因

这张图，是目标富集转录组与全转录组的比较。

横向排列的各个sgRNA干扰后全转录组的情况，纵向排列的各个sgRNA干扰后目标富集转录组的情况。格子的颜色是表示两边的一致性。

我们可以看到，从左上到右下的对角线，是一条白线，也就是相关性很好

总结

上一条：单细胞染色质共可及性分析软件Cicero的使用
下一条：单细胞转录组基础分析五：细胞再聚类

网站地图 | 法律声明 | 联系我们

地址：上海市松江区中心路1158号5幢5楼

电话：400-9200-612 传真：+86 21 6090 1207/1208-8154

dafabet手机黄金版技术（上海）有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号

友情链接：