今天跟大家分享的是一月份发表在bioscience reports.(IF: 2.535) 杂志的一篇文章,这是一篇关于ceRNA三元组与缺血性心肌病的研究。A susceptibility biomarker identification strategy based on significantly differentially expressed ceRNA triplets for ischemic cardiomyopathy缺血性心肌病中基于显著差异表达ceRNA三元组生物标志物的鉴定缺血性心肌病(ICM)是导致死亡的常见心脏病。在现有数据库中无法找到有效的ICM生物标记物。首先,根据ICM和正常样本的RNA-Seq和miRNA-Seq数据鉴定潜在的生物标志物。利用差异表达的mRNA,miRNA和lncRNA以及随机检验的方法构建ceRNA三元组。确定了8个ICM易感基因并证实对易感基因于ICM和正常的
分类准确性。这些生物标志物将有助于ICM的诊断和治疗。文章的流程图如所示。.流程图结果1. 显著差异表达的ceRNA三元组根据mRNA-miRNA、mRNA-lncRNA和miRNA-lncRNA表达值,计算相关性,得到显著相关的关系对,基于显著的调控对,构建正常和疾病中显著差异的三元组, 如表1所示。
表1.ceRNA三元组中显著差异表达的基因数目 2. 候选ICM易感基因为筛选ICM易感基因,留下包含至少一个差异miRNA或者lncRNA 的ceRNA三元组,利用富集分析的方法对68个
差异基因进行功能富集。发现富集到37个显著的GO term中,其中20个GO term是和6个ICM相关的功能类相关()。
.ceRNA三元组中
差异基因的富集分析在ICM相关功能类中,其中37个基因认为是候选的ICM易感基因,以基因表达作为特征,利用支持向量机(SVM)模型对ICM和正常样本进行预测模型构建,并利用留一法交叉证实评估预测性能,发现利用不同的核函数均具有较高的准确性,最后发现利用linear和sigmoid核函数具有最高的预测准确性()。

.37个候选易感基因的
分类ROC曲线利用linear核函数进一步对ICM易感基因类作为特征进行
分类器的构建,发现ICM易感基因功能类中基因
分类性能更高(表2)。对ICM易感基因单独作为特征,8个基因的分类AUC均大于0.75(表3)。且对于ceRNA三元组的lncRNA筛选显著的,发现8个lncRNA的分类AUC大于0.75(表3)。
表2.ICM相关功能类中基因分类性能
表3.ICM易感基因的分类准确性进一步为了评估筛选的ICM易感基因的准确性,与随机筛选的基因的分类性能进行比较,发现识别的ICM相关的mRNA和lncRNA均相对随机筛选的具有高的AUC()。并进一步通过文献查证,发现一些识别的基因与lncRNA是与心脏相关的生物学过程和功能是相关的。
.ICM易感基因分类准确性比较这些易感基因最后形成了10个差异表达的ceRNA三元组,其中七个是在ICM样本中识别的,3个样本是正常样本识别的,进一步利用三元组中的基因作为特征进行性能评估,发现基于ICM识别的七个中的五个ceRNA三元组具有好的分类性能(),而正常的三个ceRNA三元组中两个的分类性能较好()。七个ceRNA三元组中包含三个基因(FLT4, PSMB1, PKD1),也被证实与心血管功能有关。
.ICM中五个差异表达ceRNA的分类性能
.正常样本中2个差异表达ceRNA的分类性能综上,该工作基于ceRNA三元组的信息,识别8个ICM易感mRNA和8个ICM易感lncRNAs。基于显著差异表达ceRNA三元组的策略也将有助于其他复杂疾病的生物标记物的挖掘。今天的分享到此就结束了,祝开启美好的一天!欢迎关注TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史