今天小编跟大家分享的这篇文章呢,其研究内容和分析流程简单易懂,话不多说,咱们直接来看一下作者都做了哪些工作吧。
首先来温习一遍ceRNA(竞争性内源RNA):我们知道microRNA可以通过结合靶基因导致其沉默,而ceRNA可以通过应答元件(microRNA response elements,MREs)竞争性地结合microRNA来彼此正向调节。理论上,RNA分子只要有MRE,就可以成为ceRNA,而几乎每个RNA分子都至少有一个与miRNA结合的MRE位点,这就意味着ceRNA网络的繁杂。其中,IncRNA与miRNA的相互作用机制包括:miRNA结合降解IncRNA;IncRNA充当miRNA海绵吸附结合miRNA;IncRNA拆解,生成miRNA。本文就利用mRNAs,lncRNAs和miRNAs构建ceRNA网络,来分析异常表达的lncRNA与乳腺癌之间的关联。
数据和方法 研究所用的RNA测序数据下载自TCGA数据库,包括1,109个疾病样本和113个正常样本。数据预处理之后,用R包”edgeR”提取差异mRNA
、lncRNA和miRNA(|log2FC| >2.0(mRNA为1.5),adj.P<0.01);用miRcode、starBase预测DElncRNAs和DEmiRNAs,miRTarBase用来预测筛选的DEmiRNAs的靶基因;TargetScan和miRD B用来预测DEmiRNA和DEmRNA的靶向关系,然后筛选与目标DEmiRNAs互作的基因构建ceRNA网络。然后根据AUC值筛选前10个差异表达的饿lncRNAs,并做Kaplan-Meier生存分析以及log-rank检验。接下来,GEPIA数据库用来比较lncRNAs在癌旁非癌组织和癌症组织中的表达水平。最后,对特定的lncRNAs、miRNAs和mRNAs做生存分析。
结果 1).研究共识别出2,155个DEmRNAs,89个DEmiRNAs和1,028个lncRNAs。它们的聚类情况以及火山图如所示,可知三种差异RNA在两种样本中差异显著;
2). 在89个乳腺癌相关的DEmiRNAs中,作者筛选出19个miRNA(|log2 FC| >3; P<0.001)利用miRcode和starBase找到93个与之互作的lnRNAs,并利用TargetScan,miRDB和miRTar-Base数据库挖掘出27个它们靶向的mRNA; 3).基于lncRNAs-miRNAs和miRNAs-mRNAs共表达构建的ceRNA网络中包含93个lncRNAs,27个mRNAs和19个miRNAs(,红色表示上调,绿色表示下调);
4). 对93个lncRNAs做单变量Cox分析,最终筛选出前10个与乳腺癌生存分析相关的lncRNAs(),除了ADAMTS9-AS1和PWRN1外,其他8个都在癌症组织中上调,其中有6个AUC值>0.99.
5). 在生存分析结果中,有5个DElncRNAs(ADAMTS9-AS1, AL513123.1,C10orf126,LINC00536,WT1-AS),2个miRNAs,3个mRNAs(KPNA2, NTRK2和SFRP1)与总生存期相关。
这篇文献总的来说就是用传统的分析套路在新的数据中去挖掘生物标志物,小伙伴们看完是不是觉得自己发文章又有希望了呢? 好了,最后依旧是一句话送给大家:A very small man cast a very large shadow。
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史