dafabet手机黄金版_dafabet黄金手机版

晶诚所至 生命所能

Engage to Life Energy

 
CellPhoneDB细胞通讯分析及数据可视化
发布日期:2021-08-06浏览:

 

 

一、 细胞通讯机制主要分为三种类型,依次为自分泌(同一个细胞既分泌配体又有接收此配体的受体)、旁分泌(由一个细胞分泌配体另一个细胞的受体接收此配体)、近分泌(通过细胞连接等物理作用不同细胞间分泌与接收配体)和内分泌(通过血管等远距离传输分泌的配体与受体接收配体),细胞通讯分析主要的应用领域是肿瘤与免疫细胞互作,可以为肿瘤治疗的药物靶点研发提供线索。由于通过实验手段研究细胞通讯存在很大的挑战性,采用单细胞表达数据的预测方法已被广泛使用于筛选潜在的配体和受体对,它们参与细胞通讯,其中最为代表性的方法是CellPhoneDB数据库和配体与受体对的筛选方法[Mirjana Efremova, et al.],此数据库整合了IMExInnateDB等多个数据库的配体与受体来源信息,每个成员以单个蛋白质形式存在或以蛋白复合物形式参与通讯,如图1.1

 

图1.1:CellPhoneDB简介

 

 

二、 CellPhoneDB分析方法,首先需要准备高质量细胞类型的基因与细胞的标准化信号表达矩阵,依据配体与受体标准化后平均表达值乘积作为评估指标衡量两者的通讯强度,如果配体或受体是复合物形式,则采用复合物内不同基因的最小表达值表示复合物的表达值,采用随机颠换细胞类型标签的方式构造通讯强度的背景分布,通过观测值在背景分布的位置,可计算统计意义上显著性P值,可根据通讯强度和P值对配体与受体对进行重要性排序和筛选,如图2.1。

 

图2.1:CellPhoneDB 的分析方法

 

 

三、CellPhoneDB软件安装步骤,依次为下载Anaconda3(使用清华大学的镜像https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)(可参考视频<<如何使用Harmony整合单细胞数据>>)、安装Anaconda3(可参考视频<<如何使用Harmony整合单细胞数据>>)、创建CellPhoneDB环境(如图3.1)、安装cellphonedb(如图3.2)、安装R(可参考视频<<如何使用Harmony整合单细胞数据>>)和R包(circlize, ggplot2igraph,如图3.3,以circlize为例)。

 

图3.1:创建CellPhoneDB环境

 

 

图3.2:安装cellphonedb

 

 

图3.3:安装circlize包

 

  

四、使用人皮肤鳞状细胞癌微环境的示例数据来演示CellPhoneDB分析过程和结果数据可视化,这个数据集来自于肿瘤样本的14,787个单细胞,主要包括16种已知的细胞类型,依次为髓系6种亚型(巨噬细胞、CLEC9A高表达的树突状细胞、CD1C高表达的树突状细胞、骨髓来源的抑制性细胞、郎格罕不成熟的树突状细胞和浆细胞样树突状细胞)、上皮细胞4种亚型(基底、周期、分化和肿瘤特异的角质细胞)、内皮细胞、成纤维细胞、T细胞、B细胞,黑色素细胞和自然杀伤性细胞[Andrew L. Ji, et al.],细胞类型映射的UMAP图,如图4.1,基因简称与细胞的表达矩阵以稀疏矩阵格式表示,如图4.2,需注意的是表达值为标准化后非log2的信号值(可从Seurat导出),细胞注释表格,如图4.3

 

图4.1:细胞类型映射的UMAP图

 

 

图4.2:稀疏矩阵表示

 

 

图4.3:细胞注释表格

 

 

 

五、输入以上示例数据和数据库文件(可下载于https://github.com/Teichlab/cellphonedb-data/blob/master/cellphone.db),可执行cellphonedb命令(./Anaconda33/envs/CellPhoneDB/bin/cellphonedb method statistical_analysis cellinfo.txt ./ --threads 10 --database './cellphone.db' --counts-data hgnc_symbol --output-path=./如图5.1),运行结束后可产生2个重要结果文件,分别是细胞类型对与配体/受体对的平均表达值文件(means.txt、细胞类型对与配体/受体对的平均表达值的显著性P值文件(pvalues.txt),两者的格式是一样的,如图5.2,需注意的是成员A未必一定配体,B一定是受体。

 

图5.1:执行cellphonedb命令和主要参数说明

 

 

5.2:配体/受体对的平均表达值的显著性P值文件(pvalues.txt

 

 

列说明

id_cp_interaction:成员AB基因对编号

interacting_pair:成员AB基因对简称

partner_a:成员A基因Uniprot编号

gene_a:成员A基因简称

gene_b:成员B基因简称

secreted:成员AB是否包含分泌

receptot_a:成员A是否为受体

receptot_b:成员B是否为受体

annotation_strategy :注释数据库

is_integrin:成员AB是否包含整联蛋白

B|B和后续列:各个细胞类型对的显著性P 

 

六、对于以上两个文件(means.txtpvalues.txt),采用P值小于等于0.001和平均表达值大于等于1(域值只是作为参考,可自行设置)筛选任意两个细胞类型间的显著高表达的配体与受体对,可统计任意两个细胞类型间的配体与受体对总数,从而构建细胞类型相互通讯网络图,如图6.1,其中网络节点为细胞类型,网络边粗细为配体与受体对总数。绘制细胞类型相互通讯网络图的R代码,如图6.2

 

图6.1:细胞类型相互通讯网络图

 

 

图6.2:细胞类型相互通讯网络图的R代码

 

 

七、也可根据平均表达值、P值和背景专业知识筛选得到感兴趣的配体与受体对和细胞类型对,绘制细胞类型、配体与受体对平均表达值与P值的热图,如图7.1,其中每个点大小与-log10(P)值成正比,颜色从黑蓝黄红梯度与log2(mean)值成正比。绘制细胞类型、配体与受体对平均表达值与P值的热图R代码,如图7.2。

  

图7.1:配体与受体对平均表达值与P值的热图

 

图7.2:细胞类型、配体与受体对平均表达值与P值的热图R代码

 

 

八、最后可根据平均表达值、P值和背景专业知识筛选得到的配体与受体对和细胞类型对,绘制细胞类型、配体与受体对圈图,如图8.1,其中最外围为细胞类型,内部是筛选的配体或者受体基因,连线表示两者的互作。绘制细胞类型、配体与受体对圈图R代码,如图8.2。

图8.1:细胞类型、配体与受体对圈图

 

图8.2:绘制细胞类型、配体与受体对圈图R代码

 

 

参考文献:

 

[1] Mirjana Efremova, et al. CellPhoneDB: inferring cell-cell communication from combined expression of multi-subunit ligand-receptor complexes. Nat Protoc. 2020. Apr. 15(4):1484-1506.doi: 10.1038/s41596-020-0292-x.

[2] Andrew L. Ji, et al., Multimodal Analysis of Composition and Spatial Architecture in Human Squamous Cell Carcinoma. Cell. 2020 Jul.




 

 

上一条:七夕福利|科研人土味情话大赏
下一条:奔涌吧,后浪|dafabet手机黄金版开展新员工迎新破冰团建活动
返回
网站地图 | 法律声明 | 联系我们

地址:上海市松江区中心路1158号5幢5楼

电话:400-9200-612  传真:+86 21 6090 1207/1208-8154

dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号

友情链接: