小编今天跟大家分享的是7月19号发表在frontiers in Genetics(IF=3.517)上的一篇文章
Survival Analysis of Multi-Omics Data Identifies Potential Prognostic
Markers of Pancreatic Ductal Adenocarcinoma
该文章整合了基因、甲基化、miRNA、lncRNA多组学数据集,通过差异的甲基化分析、差异甲基化区域分析、差异表达基因分析以及生存分析识别与PDAC预后相关基因、miRNA、lncRNA、cPGs生物标记。
数据
TCGA153名确定PDAC患者
DNA methylation 数据
mRNA 表达数据
lncRNA 表达数据
microRNA 表达数据
去掉缺失值>=20%的数据
路线
一、 识别PDAC相关甲基化位点和甲基化区域:
当进行多个样本比较时,需要进行差异甲基化分析、差异甲基化区域(DMR)等分析,以寻找样本间特异、特有的甲基化模式
1差异甲基化分析 方法:R 包(limma)得到了12,083差异甲基化位点(∆β ≥ |0.2|)
基本分布:在启动子和CpG岛超甲基化,在远离启动子区域去甲基化;chr1、chr2差异甲基化数目最高chr14 、chr15最低。基因启动子区域的高甲基化CpG位点簇通常与基因的表观遗传沉默有关。
2 差异甲基化区域分析 方法:DMRcate 识别得到了最多779 DMRs in chr7 最低6 DMRs in chr21。调控功能的甲基化位点通常处于短区域:116 DMRs 为短的DMRs(<100bp)。
二、 筛选差异表达数据:
为了获取胰腺导管腺癌差异表达基因使用DESeq2进行差异表达基因的筛选,得到了90个差异表达基因(80 protein-coding, seven lncRNA, two antisenses,and one Ig-V gene)
三、 启动子区域DNA甲基化和基因表达关联分析
方法:R 包:cor.test 斯皮尔曼相关系数P<=0.005且rho>=|0.25|
1、4,971 CpG和1,744 genes显著相关, 其中4,568 CpGs 与1,602 genes表达显著负相关;407 CpGs和212 genes表达显著正相关
2、199 CpGs 和84 lncRNAs显著相关, 其中174 CpGs与72 lncRNAs表达显著负相关, and 25 CpGs和12 lncRNAs表达显著正相关
四、 KEGG通路富集分析
差异甲基化主要富集在MAPK、Rap1、钙信号通路和尼古丁成瘾通路(临床数据表明病人为吸烟者);80个差异表达基因没有观测到显著富集通路
五、 生存分析识别与PDAC预后相关的marker(整体的)
Cox回归分析分对DNA methylation, gene expression, miRNA, and lncRNA分别做生存分析,识别得到与生存相关的基因、CpG位点、lncRNA、miRNA。
p-value ≤ 0.01显著性阈值下:
与生存相关的CpG位点:80
与生存相关的gene: 518
与生存相关的lncRNA:74
与生存相关的miRNA:7
六、 综合性分析cPG岛负相关基因表达与PDAC生存的关系
共识别了与预后相关的17 genes 、4 CpGs、 2 lncRNA
作者发现MUC2、MUC5B、MUC13等基因在PDAC中显著上调,于是返场系统研究了下 Mucin Family。
欢迎关注
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史