Engage to Life Energy
这篇文章的题目是《High-Throughput Discovery and Characterization of Human Transcriptional Effectors》,发表在Cell杂志2020年的12月刊上。
文章的题目,翻译成中文,意思是《对人类转录效应子的高通量发现和表征》
文章的第一作者,是斯坦福大学遗传学系的Josh Tycko
实验内容的第一部分,用HT-Recruit 鉴定人类蛋白质中的数百个抑制域
这是HT-Recruit的整体工作流程。我们接下来会把这些步骤分拆开,进行讲解
这是报告细胞的基因特点。
在pEF这个启动子的下游,是两个基因。紫色的这个Surface marker基因,这是一个可以翻译出膜表面蛋白,这个蛋白会被磁珠吸附,
后面Citrine基因,会翻译出一个有黄色荧光的蛋白。
Surface marker基因和Citrine基因之间,连了一个T2A的序列,这个序列有一个特点,就是一个翻译阅读框中有这个T2A序列,那翻译出来的蛋白就容易在T2A这个位置断掉,变成2条蛋白。这是T2A这个序列的用处,让一个启动子,可以翻译出2个蛋白。
在pEF启动子的上游,是9x TetO这个蛋白结合位点,就是TetO的序列重复了9次,这个TetO序列是被四环素类药物操纵的,当有四环素类药物存在时,这个操纵子抑制下游的基因,让下游基因不表达,如果没有四环素的药物存在时,下游基因会表达。这个TetO序列重复9次,会加强这种抑制作用
如果这个位点被rTetR结构域的蛋白结合了,就会抑制下游的启动子的启动转录的作用。
rTetR是reverse Tet repressor的首字母缩写,中文意思是反式四环素控制的转录系统的抑制子。
这是设计用来做干扰报告基因表达的蛋白结构域的方法。
先从Pfam这个数据库中找出核蛋白的结构域,
以80个氨基酸的长度为标准,如果比80个氨基酸短的,就用蛋白在目标结构域边上原来的序列补齐到80个氨基酸。
80个氨基酸就对应着240个核苷酸碱基。
把这些240个碱基的核酸序列用芯片高通量合成的办法合成出核酸片段文库。
再把这些文库插到质粒载体中去。
这个质粒中,已经有的rTetR这个基因的序列,插入的240个碱基的核酸片段会与它形成融合基因。
接着,带有融合基因的质粒库被包装成慢病毒,用来转染培养细胞。
转染进细胞后,载体上的融合基因就翻译出蛋白,
这个蛋白,本来就有rTetR这个结构域,本来就可以与培养细胞中的9x TetO这个序列结合,来抑制下游的报告基因的表达。
现在,加上了新的结构域,也就是图中,彩色的这些蛋白片段,那这些新加上的蛋白片段就会影响下游的报告基因的表达。
培养的细胞,在没有被转染的时候,是会正常表达Citrine这个报告基因,会有荧光蛋白,并且还会表达报告基因中的特定的细胞表面蛋白。
在被转染后,就会有一部分的细胞不能表达Citrine这个荧光蛋白,也不能表达报告基因的细胞表面蛋白。
作者接下来用磁珠来吸附分选这些被转染的细胞。
不表达表面蛋白的细胞,也就是off的细胞
和能表达表面蛋白的细胞,也就是on的细胞,就被分开,
被分别做单细胞建库、测序。
接下来,再分析被磁珠吸附,与不被磁珠吸附的细胞的表达差异。
方法建立之后,作者先验证方法结果的重复性。
作者对每个实验做2个生物学重复。
图中,是2个生物学重复的细胞中各个插入结构域引起的报告基因的表达改变做对比。
横轴是生物学重复中的第一次实验,
纵轴是生物学重复的第二次实验。
图中的点是被特定的结构域影响之后报告基因的表达的改变程度,因为是比较二次生物学重复的结果,
那么如果这些点越靠近从左下到右上的对角线,那么就是重复性就越好。反之,如果点是偏离对角线的,重复性就不好。
我们看这三张图,分别是实验的第5天、第9天、第13天的结果。
我们看到大多数的点都处在对角线附近,并且相关系统r平方,都是0.96、0.92、0.89.
这就说明这个方法的生物学重复性是比较好的。
从分析中,找到了446个抑制子,分属于63个结构域家族。
其中典型的如:KRAB结构域家族,和Chromo_shadow家族。
接着,作者研究了各个结构域在细胞中形成的记忆效应。
就是看先加入四环,再撤掉四环素。看第5天,和第13天的时候的报告基因的表达。
结果发现C2H2锌指转录因子,有很强的记忆效应。
发现,RYBP是一个沉默效应很强的结构域。
在这张图中,最左边是的单独的rTetR,也就是空白对照组,我们看到峰的大部分在图的右侧
第二列,是RYBP,很明显,用药后,峰从右边移到了左边,这说明RYBP是一个沉默效应很强的结构域
第三列、和第四列,是两个DUF,DUF是功能还没有被明确的结构域的意思,DUF,是Domain of unknown function的首字母缩写。可以看到,这两列,峰的左移情况有,但不是很明显。
实验内容的第二部分,鉴定功能没确定的结构域中抑制转录的功能
在Pfam数据库的结构域中,有超过22%是被标为DUF的,刚才我们提过,DUF就是domain of unknown function的,也就是还没有确定功能的结构域的意思。
作者的高通量结构域扫描方法,提供了一种给DUF确定功能的机会。
例如:作者发现DF3669,是一种抑制子。而DF3669是在KRAB锌指蛋白中被发现的。
同样,HERC2中的Cyt-b5,被确认为强的抑制子
同样,作者还确认了其它几个是抑制因子的结构域。
实验内容的第三部分,在进化较近的蛋白中发现了抑制因子 KRAB 结构域
这张图中,横座标是进化中各个时代的动物,越靠右,离现代人类越接近
纵座标是KRAB结构域产生的抑制的强度,
可以明确地看,从动物进化史上,到离人越近的动物,KRAB对基因的抑制效果越好。
实验内容的第四部分,对 CRISPRi ZNF10 KRAB 作用因子深度突变扫描
来自ZNF10蛋白的KRAB结构域,已被广泛应用于基因工程中。
为了更好地理解它的序列与它的功能的关系,作者用HT-recruit方法对它做了一个突变库。
这个库中包含了所有可能单氨基酸替换、或所有的所续双氨基酸突变和三氨基酸突变。
图中,红色标出的,就是突变的氨基酸,或核酸碱基
作者用突变后的库,做HT-recruit检测
这是KRAB突变后,对目标基因的沉默效果。
图中,棕色格子,就是KRAB突变后抑制力大大下降的;蓝色的格子,就是KRAB突变后,抑制力大幅上升的
我们可以看到,这KRAB分成三段。
其中A-box,对于抑制力,是必须的。突变之后,很容易丧失抑制力
B-box,对于抑制力,有潜在的效用。突变之后,有一定程度会丧失抑制力,
并且这些引起抑制力丧失的突变集中在第59个氨基酸
N端,不是很重要。甚至,N端有几个位置的特定突变,还会加强沉默作用
作者把box-A的突变影射到小鼠的KRAB结构域中,发现有10~12个氨基酸,对KRAB结合到KAP1是有用的。也就是图中红颜色的这些氨基酸
实验内容的第五部分,同源域抑制因子的强度与 Hox 基因的组织相关
抑制因子中的第二大家族是同源域家族。
其中:PRD、NKL、HOXL和LIM是比较大的四个亚家族
Hox基因族,是包含在HOXL亚家族中的。
Hox基因族,有39个成员。这张图,列出这这些基因的同源情况。
并且请注意一下这里红颜色标注的RKKR这段相对保守的序列。
Hox基因家族,又分成A、B、C、D,这样4类,
这个胚胎的图中,画了两条紧挨着的轴,一条是胚胎从头到尾的发育的轴,另一条是Hox基因家族各成员表达的轴。
我们可以看到,这两条轴上,色块的排列的走向有一致性。
下面的点阵图,是表示Hox产生的对报告基因表达的抑制作用,
横轴是把胚胎分成13个节段,纵轴是四个基因亚族的表达量
我们可以看到,图中的点,大致排布在从左下方到右上方的对角线方向上。
这就说明了Hox基因家族在胚胎上的表达的空间递减的效应。
在Hox基因家族中,N端带的碱性氨基酸就越多。
抑制效果就越强,
而氨基酸残基越多,就是带的正电荷越多。
相关性系数,R平方,是0.85
我们刚才提到Hox基因家族中,N端有相对保守的RKKR序列。
R是赖氨酸,K是精氨酸,都是典型的碱性氨基酸,这样四个碱性氨基酸连在一起,会有很大的正电性。
而Hox的N端的序列如果有更多的会带正电的碱性氨基酸,会增强Hox抑制子的抑制效果。
实验内容的第六部分,用 HT-Recruit 结合小启动子发现转录激活因子
与前面做抑制子的报告系统类似,作者又做了一个,基于minCMV启动子的激活报告系统。
与之前做抑制功能的差别在于,这次用的启动子是minCMV,这个启动子在有rTetR作用时,是激活下游基因的转录的。
在这张图中,横轴上,越靠左,是激动程度越高,
图中的虚线,是有明显激活作用的阈值。
纵轴上,排列的各个结构域
最上面三个红颜色标的结构域,是已知有激活功能的结构域,也就是阳性对照物。
我们可以看到,除阳性对照之外,还有若干个有激活功能的结构域被测到。
实验内容的第七部分,发现 KRAB 的激活域
在寻找激活域的工作中,令作者感到吃惊的是,最强的激活域,是来自ZNF473的KRAB域。
另外,来自ZFP2、ZNF496和ZNF597的KRAB域都是激活域。
成为激活域的KRAB域,是所有KRAB域中的一小部分,也就是图中用绿色标出来的这部分。
这些激活域的KRAB,与其它大部分的KRAB共享大部分序列,但还有自己独特的一些序列。
作者进一步验证了ZNF473 KRAB与ZFP28 KRAB_2的激活功能。
可以看到ZNF473的这个KRAB,可以把峰右移一大截。
而ZFP28的这个KRAB,可以把峰右移一点。
实验内容的第8部分,交错叠瓦文库揭示了核蛋白的未注释区域中的效应域
接着,作者要把所有的核蛋白质中的各个域是否有抑制功能做一下扫描。
从图中可以看到,作者是取80个氨基酸残基的长度,作为一窗口,每隔10个氨基酸挪一次,把238个核蛋白做扫描。
这是被测试的蛋白,按照第5天报告基因被抑制的效果进行排列,得到的图。
在这项工作中,验证过去已发现的某些结构域所拥有的抑制功能
例如CTCF这个基因的第121到第200个氨基酸之间有强的抑制功能
另外,还发现某些结构域拥有之前未知的抑制功能
例如:这个BAZ2A这个基因有抑制功能,但之前数据库中没有被注释说有抑制功能
对于某些之前已知有抑制功能的基因,但没有把抑制功能定位到精确的结构域的,现在可以定位到精确的结构域了。
例如这个MGA基因,通过HT-recruit方法,把抑制功能定位到第341-420个氨基酸,和第2381-460个氨基酸,这样两个结构域。
因为HT-recruit方法是用,叠瓦式的、交错10个氨基酸的片段来测结构域的功能的,所以可以把真正有抑制功能的区域进一步缩小。
例如:这个MGA基因,通过对交错的片段的功能交集的分析,把有抑制功能的蛋白序列范围进一步缩小到第381-390个氨基酸,和第2431-2460个氨基酸。
然后,作者把缩小范围的片段插入载体中,做转染实验,证实,这两个更小的片段,就是起到抑制作用。
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy