Engage to Life Energy
ESTIMATE方法简介
ESTIMATE方法全称为Estimation of STromal and Immune cells in MAlignantTumours using Expression data),此方法基于Bulk RNA-Seq表达数据可用于估计恶性肿瘤中基质与免疫细胞比例以及肿瘤细胞的纯度,发表于2013年Nat Commun,当时主要的创新点在于设计了两组特征基因列表(分别142个,https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3826632/bin/ncomms3612-s2.xlsx),如图1。分别针对于肿瘤样本中的基质细胞与免疫细胞,这里的基质细胞主要是指成纤维、血管内皮细胞、周细胞与平滑肌细胞等,而免疫细胞主要包括浸润于肿瘤组织的淋巴细胞(T和B)、髓系细胞(巨噬、树突状与粒细胞)与肥大细胞[1]。目前此方法应用较为广泛,Google引用率达到3千次以上。
图1,ESTIMATE的特征基因筛选过程
ESTIMATE基本原理
对于所有编码蛋白质的基因(过滤低丰度表达的基因)作为参考基因列表,根据设计的特征基因列表将其分割为特征基因列表与非特征基因列表,将连续型信号的表达数值,通常使用Log2(FPKM+1)(Fragments Per Kilobase of exon model per Million mapped fragments)转换为等级信号(Rank,比如1、2、3、4、5……)并排序,此过程也叫做Rank标准化与排序,这样可进行特征基因列表与非特征基因列表的经验累积分布计算,两者之差并求和即可得到基质得分(StromalScore)、免疫得分(ImmuneScore)和基质+免疫得分(ESTIMATEScore)。ImmuneScore可作为肿瘤分子分型的一个有用指标,可将ESTIMATEScore输入经验公式 cos(0.6049872018 + 0.0001467884 * x) 来估计恶性肿瘤细胞的纯度(TumorPurity)。
ESTIMATE分析操作与结果展示
表1,ESTIMATE的输入文件格式,说明:第二行依次为基因数与样本数
由于ESTIMATE方法是采用R语言编写,ESTIMATE包的安装命令为install.packages("estimate",repos="http://r-forge.r-project.org", dependencies=TRUE),当ESTIMATE安装成功后,可采用library(estimate); estimateScore("example.gct", "estimate.xls", platform = c("illumina")),产生结果文件estimate.xls(如表2)。从分析结果来看LAUD相比于LUSC的免疫得分显著性偏高(如图2),肿瘤纯度估计值与基于拷贝数的ABSOLUTE_Purity值呈现显著的相关性(如图3)。
表2,ESTIMATE分析结果文件,注:行依次为StromalScore、ImmuneScore、ESTIMATEScore和TumorPurity
图2,LAUD相比于LUSC免疫得分的小提琴图
图3,TumorPurity与ABSOLUTE_Purity的散点图
ESTIMATE参考文献
[1] Kosuke Yoshihara et al., Inferring tumour purity and stromal and immune cell admixture from expression data. Nat Commun. 2013;4:2612. doi: 10.1038/ncomms3612.
地址:上海市松江区中心路1158号5幢5楼
电话:400-9200-612 传真:+86 21 6090 1207/1208-8154
dafabet手机黄金版技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号
微信:genenergy