RNAmiRNA、甲基化联合分析思路分享

admin 96 2025-01-14 编辑

小编今天跟大家分享的是7月19号发表在frontiers in Genetics(IF=3.517)上的一篇文章

Survival Analysis of Multi-Omics Data Identifies Potential Prognostic

Markers of Pancreatic Ductal Adenocarcinoma

该文章整合了基因、甲基化、miRNA、lncRNA多组学数据集,通过差异的甲基化分析、差异甲基化区域分析、差异表达基因分析以及生存分析识别与PDAC预后相关基因、miRNA、lncRNA、cPGs生物标记。

数据

TCGA153名确定PDAC患者

DNA methylation 数据

mRNA 表达数据

lncRNA 表达数据

microRNA 表达数据

去掉缺失值>=20%的数据

路线

一、 识别PDAC相关甲基化位点和甲基化区域:

当进行多个样本比较时,需要进行差异甲基化分析、差异甲基化区域(DMR)等分析,以寻找样本间特异、特有的甲基化模式

1差异甲基化分析 方法:R 包(limma)得到了12,083差异甲基化位点(∆β ≥ |0.2|)

基本分布:在启动子和CpG岛超甲基化,在远离启动子区域去甲基化;chr1、chr2差异甲基化数目最高chr14 、chr15最低。基因启动子区域的高甲基化CpG位点簇通常与基因的表观遗传沉默有关。

2 差异甲基化区域分析 方法:DMRcate 识别得到了最多779 DMRs in chr7 最低6 DMRs in chr21。调控功能的甲基化位点通常处于短区域:116 DMRs 为短的DMRs(<100bp)。

 二、 筛选差异表达数据:

为了获取胰腺导管腺癌差异表达基因使用DESeq2进行差异表达基因的筛选,得到了90个差异表达基因(80 protein-coding, seven lncRNA, two antisenses,and one Ig-V gene)

三、 启动子区域DNA甲基化和基因表达关联分析

方法:R 包:cor.test  斯皮尔曼相关系数P<=0.005且rho>=|0.25|

1、4,971 CpG和1,744 genes显著相关, 其中4,568 CpGs 与1,602 genes表达显著负相关;407 CpGs和212 genes表达显著正相关

2、199 CpGs 和84 lncRNAs显著相关, 其中174 CpGs与72 lncRNAs表达显著负相关, and 25 CpGs和12 lncRNAs表达显著正相关

四、 KEGG通路富集分析

差异甲基化主要富集在MAPK、Rap1、钙信号通路和尼古丁成瘾通路(临床数据表明病人为吸烟者);80个差异表达基因没有观测到显著富集通路

 

五、 生存分析识别与PDAC预后相关的marker(整体的)

Cox回归分析分对DNA methylation, gene expression, miRNA, and lncRNA分别做生存分析,识别得到与生存相关的基因、CpG位点、lncRNA、miRNA。

p-value ≤ 0.01显著性阈值下:

与生存相关的CpG位点:80

与生存相关的gene: 518

与生存相关的lncRNA:74

与生存相关的miRNA:7

六、 综合性分析cPG岛负相关基因表达与PDAC生存的关系

共识别了与预后相关的17 genes 、4 CpGs、 2 lncRNA

作者发现MUC2、MUC5B、MUC13等基因在PDAC中显著上调,于是返场系统研究了下 Mucin Family。

欢迎关注

TCGA | 小工具 | 数据库 |组装| 注释 |   基因家族  |  Pvalue

基因预测  |bestorf |  sci | NAR | 在线工具 | 生存分析 | 热图

 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos

 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 |  进化 | 测序简史

 

RNA、miRNA、甲基化联合分析思路分享

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 如何利用DAVID做富集分析
相关文章