多组学分析思路分享

admin 11 2025-02-01 编辑

小编今天跟大家分享的是6月29号刚发表在AGING-US上的一篇文章。

 这篇文章通过整合351个卵巢癌患者的DNA拷贝数变异(CNV),甲基化变异(MET)和mRNA表达数据来识别预后标志物,并将基因分为三种亚型:iC1,iC2,iC3。通过比较亚型间的CNV, MET和mRNA表达数据,识别出两个与预后相关的基因UBB和IL18BP。

  

数据:351名患者(3个数据集)的临床随访数据、CNV, MET, RNA-seq和SNV数据都下载自TCGA。

方法: (1) 对CNV数据,重叠>50%的两个区域认为是相同的,删除探针数<5的区域,最后用GRCh38 release 22匹配到基因,多个区域对应一个基因时取其均值;对MET数据,删除在>70%的样本中缺失的位点,缺失数据用KNN算法补值,TSS上游2kb到下游200bp区域的探针同样匹配到相应基因;RNA-seq数据删除低表达的基因(FPKM = 0 in <0.5% of all samples);SNV数据删除沉默突变和内含子突变。

(2) 识别CNVcor和METcor基因集:分别计算CNV和RNA-seq、MET和RNA-seq间的Pearson相关系数,筛选p < 0.05的基因。

(3) 通过整合CNVcor中基因的CNV数据,METcor中基因的MET数据以及两个基因集中基因的EXP数据,使用R包“iCluster”对样本聚类。

(4) KMplot website用来评估数据,基于感兴趣基因的表达值,样本被分成两组,并且画出了相应的生存曲线。

 

结果: (1) 设定p<0.01,共筛选出3,990 个CNVcor基因和9,651个 METcor基因,其中,选择与预后显著相关的基因做后续研究(p < 0.05, 413个CNVcor和103个METcor基因)。CNVcor中的基因CNV值与表达值之间多呈现正相关,而METcor中的基因与基因表达则呈现负相关,而且CNVcor基因大多位于chr14, chr11, chr12和chr1,METcor基因则倾向于出现在chr12 and chr15, chr14 和chr16。

(2) 用非负矩阵分解方法(NMF)分别对两个基因集聚类,经过比较,簇的个数都定为3(.A,1.B);CNVcor和METcor的三个类之间的总生存期都有显著差异(.C,1.D);第三类亚型中,两个基因集重叠较多(.E,1.F)。

 

(3) 基于CNVcor和METcor的表达值,最终将基因分成iC1 (66 samples), iC2 (128 samples)和iC3 (156 samples)三类()。这三种亚型中的基因与CNVcor和METcor亚型中的基因交集比较多。

 

(4)  CNV和MET变异之间的关系:β>0.3定义为CNV扩增(CNV Gain),β<-0.3为CNV缺失(CNV Loss),β>0.8定义为高甲基化(MetHyper),β<0.2为低甲基化(MetHypo),计算了每个样本这四种变异的基因数。CNV Gain和CNV Loss,CNV Gain和MetHypo都呈现出正相关;CNV Loss和MetHyper,CNV Loss和MetHypo都是负相关。()

 

(5)  由于亚型iC1和iC3的CNV, MET和mRNA表达都存在明显差异,因此作者将样本分为三类:CNV Gain (MetHyper), CNV Loss (MetHypo)和CNV Normal (MET Normal)。然后,用Fisher-exact检验识别两种亚型的CNV和MET数据中显著差异的基因,用DESeq2识别表达数据中显著差异的基因。为进一步探究CNV,MET,基因表达之间的关系,作者筛选出了在iC1和iC2的表达数据、CNV Gain/Loss 、MetHypo/MetHyper中都显著差异基因做生存分析,共得到7个基因:URI1, AKT2, ZHX3, RAB34, FBXO6, IL18BP, UBB。其中,UBB、IL18BP与预后显著相关,当UBB和IL18BP都低表达时,预后较差。此外,在预后较差的标本中,这两个基因在iC1亚型中的表达低于iC3亚型,可能由iC1亚型中MET水平较高,CNV水平较低所致()。相关性分析表明,SNV基因突变位点与IL18BP和UBB的表达显著相关。

总结一下,本文利用TCGA数据库中的351例卵巢癌患者的表达谱数据,识别出了一个对CNVcor基因集和METcor基因集,并将本分成了iC1, iC2, iC3三种亚型。通过分析iC1和iC3亚型在CNV、MET和基因表达水平上的差异,最终筛选出两个与预后显著相关的基因,并用多套数据集对其进行了验证。

以上同款,扫码立得

多组学分析思路分享

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: CAMOIP,关于追“星”这件事
相关文章