数据库介绍:《TIGER》,肿瘤免疫治疗相关的在线分析数据库

admin 49 2025-01-07 编辑

大家好,今天给大家介绍一个数据库网站,生物信息学文章日益增多,在线零代码分析的肿瘤数据库也越来越多,大部分都是连接到TCGA数据库的癌症数据,从GEPIA到TIMER,涉及的方向也是越来越多,从基础的表达量分析到生存分析,到近来的免疫浸润以及日益火爆的单细胞分析,简单直观明了的操作界面帮助我们快捷方便的完成论文中的图标制作,图片质量也越来越高。

同时,恶性肿瘤是机体正常细胞癌变的产物, 具有不断增殖并有可能在体内转移的特点。为了生存和生长, 肿瘤细胞能够采用不同策略抑制人体的免疫系统, 使其不能正常地杀伤肿瘤细胞, 从而在抗肿瘤免疫应答的各阶段得以幸存。简单来说,免疫治疗的目的其实就是通过调动人体强大的免疫系统来对抗癌症。通过分离获取的患者自身免疫细胞, 在细胞因子的诱导下,大量扩增出具有高度抗肿瘤活性的免疫细胞,回输到患者体内以恢复患者免疫的力量进而攻击肿瘤。渐渐的,免疫治疗在癌症治疗领域不断展现实力,逐渐成为癌症治疗炙手可热的明星疗法。在多个复发或难治性的恶性肿瘤中都展现了十分强劲的治疗效果;那么今天我们来介绍一个与肿瘤免疫治疗相关的在线数据库——“TIGER”。

文章名称:

TIGER: A Web Portal of Tumor Immunotherapy Gene Expression Resource

DOI:https://doi.org/10.1016/j.gpb.2022.08.004

杂志:Journal Pre-proofs ,if:7.614(一区)

方法学部分:

数据的来源与处理方法:

与其他很多癌症数据库类似,TIGER数据库也是与TCGA数据库链接的,构建数据库的肿瘤和正常RNA-seq样本数据来自于UCSC Xena数据库。

通过搜索immunotherapy, programmed cell death protein 1 (PD-1) inhibitors, and cytotoxic, T-lymphocyte antigen 4 (CLTA4) inhibitors等关键词,从GEO和SRA 数据库中收集具有临床免疫治疗信息的肿瘤样本的bulk RNA-seq和基因表达芯片数据。但是在没有原始数据的情况下,则会使用预处理数据,小编认为这将不可避免地造成一些数据上的误差,但是影响不大。

另外人类肿瘤的单细胞bulk RNA-seq是在GEO、Genome Sequence Archive (GSA) 、EMBL-EBI 、Single-Cell Portal数据库中通过检索single-cell、scRNA-seq、10x Genomics、inDrop、Smart-seq2等关键词收集的。

单细胞数据的预处理方法是:

利用STAR将FASTQ格式的reads与人类参考基因组进行比对,然后利用Cell Ranger导出基因表达矩阵。使用Seurat (v3.1.3) R 包对每个单细胞bulk RNA-seq数据集进行质量控制。首先,线粒体RNA含量超过10%的细胞被认为已经死亡或正在死亡,并被移除。reads数小于200或大于3000的细胞也被排除。同时表达以上三种标记物(CD2、CD79A和CD68)中一个或多个的细胞被定义为二聚体并去除。其次,将过滤后的每个样本的基因表达矩阵用Seurat包的NormalizeData函数进行归一化,用FindVariableFeatures函数保留高变异基因;最后,利用FindVariableFeatures和Integratedata函数对所有样本的基因表达矩阵进行整合,并对不同样本之间的批次效应进行校正。接下来则是常规的细胞聚类和细胞亚群注释。

随后,对单细胞的肿瘤样本与正常样本进行差异分析,通路富集分析,不同细胞类型间基因对的皮尔森相关性分析,细胞轨迹分析,细胞通讯分析。

bulk基因表达数据分析:

去除低质量的探针数据,对探针进行注释,并将数据转换为FPKM类型。

接下来对数据进行差异分析,生存分析,相关性分析,预测免疫治疗的反应。预测免疫治疗反应的特征基因从文献中获得,每个特征基因的得分根据原研究中使用的参数计算。我们采用RRA算法以无偏差的方式整合所有特征基因的得分。整合后的得分用于预测癌症患者的免疫治疗反应。

最终以上的所有分析结果,以及TIGER中的所有数据都以MySQL表、JSON文件、Rds和RData文件的形式保存。Web接口已包括PHP、HTML、JavaScript和CSS。并使用ECharts和Rscripts生成统计图。

数据库首页:

TIGER是一个与肿瘤免疫相关的、可基于表达数据进行多项分析的网站。TIGER包含来自TCGA的1508个具有免疫治疗临床结局的肿瘤样本和11057个肿瘤/正常样本的批量转录组数据,以及655个样本、2116945个细胞的单细胞转录组数据,其中63个样本的119039个细胞具有免疫治疗临床数据。此外,作者还收集了8个CRISPR和2个shRNA screen数据,这些数据来自于抗癌免疫反应基因的研究。并从公共文献中收集了11个可能用于预测免疫治疗反应的特征基因。

数据库的使用:

TIGER由四个主要模块组成,包括免疫治疗反应模块、反应特征模块、单细胞免疫模块和快速搜索免疫筛选模块。

1.快速搜索:当用户进入网站时,可以在页面中间看到一个快速搜索栏。用户可以通过搜索感兴趣的基因Symbol,得到在所有数据集中具有显著差异的结果,如不同细胞类型下肿瘤组织与正常组织的差异,免疫治疗反应样本与非反应样本的差异。

2.基因信息:内含基因信息的总结,包括基因信息(Gene Information)和通路信息(Pathway Information)。

3.单细胞免疫:在单细胞免疫模块中,用户可以悬停在图中圆点上或对表格排序,以发现不同癌症的细胞类型标记基因。此外,用户可以单击表的选项卡来显示数据集中这种细胞类型的详细图像。

在表达相关性分析中,用户可以计算一个感兴趣的基因与其他基因的表达之间的相关性,也可以基于输入基因计算不同细胞类型中的表达相关性。在差异表达分析中,用户可以点击表格选项卡查看详细信息,该详细信息由UMAP图和条形图组成,用于可视化所选基因在不同组之间的差异表达。

4.免疫治疗反应: TIGER会展示差异表达分析和生存分析。散点图和表格将显示每个数据集的具体差异分析结果。

5.反应特征:在AUC Matrix和Survival Matrix中,用户可以利用基因表达数据和免疫治疗临床信息,将自己的特征基因与已知的免疫治疗响应特征基因进行比较

在Correlation Matrix中,用户可以在没有免疫治疗临床信息的情况下,使用TCGA基因表达数据来探索感兴趣的基因是否与已知的免疫治疗特征基因相关。

6.免疫筛选:CRISPR screen和RNAi Screen相关的基因信息将以表格的形式显示,点击表格即可获得数据集相关信息。

小结:

TIGER 可以对与癌症免疫治疗相关的基因或单细胞转录组的基因表达数据进行综合分析。与 TCIA、TIDE 和 TISCH 等其他现有工具相比,TIGER 具有多个优势:

1. TIGER 是第一个整合了癌症bulk RNA-seq、芯片数据和单细胞基因表达数据,并用以发现癌症免疫治疗中的抗肿瘤免疫机制并反应生物标志物的在线数据库。

2. TIGER 拥有最全面的癌症免疫治疗相关转录组基因表达数据,包含了33 种癌症类型的 11,057 个肿瘤和正常样本的非免疫疗法基因表达数据、8 种癌症类型的 1508 个肿瘤样本的免疫疗法基因表达数据,以及来自 25 种癌症类型的 655 个样本的 2,116,945 个细胞的单细胞基因表达数据。

3. 与其他工具相比,TIGER 包含更多用于bulk RNA-seq和单细胞基因表达数据的分析和可视化功能。特别是,使用 scbulk RNA-seq在肿瘤和正常细胞之间以及不同细胞类型之间进行差异分析,使用户能够探索抗肿瘤免疫并开发特定细胞类型的基因特征。

数据库介绍:《TIGER》,肿瘤免疫治疗相关的在线分析数据库

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 孟德尔随机分析
相关文章