肥厚型心肌病中核编码线粒体基因的系统
生物信息学分析大家好,今年给大家分享的是今年5月12日发表在Frontiers in Genetics[IF=3.258]期刊上面的一篇文章,它主要介绍了肥厚型心肌病是一种常染色体显性遗传病,线粒体在HCM的发病过程中起关键作用。作者分析了核编码的线粒体基因(NMGene)在HCM中的整体表达模式,并为HCM的分子机制提供了创新性的见解。数据来源从GEO数据库下载了归一化处理后的基因表达数据集GSE36961,其中包括107个HCM样本和40个对照样本。NMGene是来自MitoCarta、MitoMiner、IMPI和UniProt数据库。主要方法差异表达分析:为了识别HCM和正常健康心脏之间的差异表达基因,研究者使用了R包“Limma”,并选择BH校正后p值<0.01且FC>1.2的基因作为显著的差异表达基因;功能富集分析:使用在线功能注释工具DAVID对差异表达的NMGene(DE-NMGene)进行GO BP和KEGG通路富集分析,以了解基因的生物学意义;PPI网络构建:使用STRING数据库构建了DE-NMGene的PPI网络,保留了互作评分>0.7的DE-NMGene之间的PPI;网络模块分析:网络模块被定义为参与相同生物功能的一组基因,使用Cytoscape中的插件MCODE从构建的PPI网络中挖掘出网络模块。参数设置为:度阈值为2,节点得分阈值为0.2,k得分为2,最大深度为100。筛选得分>3且节点数>5的模块以进行下一步分析;调控DE-NMGene的转录因子预测:为了预测调控DE-NMGene的转录因子(TF),研究者使用了Cytoscape中的插件iRegulon。iRegulon插件使用一组共调控基因中的motif和track发现来识别调节子。归一化富集评分(NES)越高,TF越可靠。结果核编码的线粒体基因在HCM中显著变化在差异表达分析中,共获得了2927个差异表达基因(DEG),其中1499个上调,其余1428个下调(A)。为了探索NMGene在HCM中的表达模式,从MitoCarta、MitoMiner、IMPI和UniProt数据库中收集了1943个线粒体基因(B)。去除13个线粒体
DNA编码的基因后,保留了1930个NMGene用于进一步分析。在这些基因中,芯片检测到1562个基因,其中包括316个差异表达基因。与芯片上检测到的全部基因相比,NMGene中DEG的比例明显更高(C)。NMGene在HCM中的普遍表达变化表明线粒体在HCM的进程中起关键作用。表1列出了HCM中前10个上调和下调的NMGene。在这些基因中,4个上调基因(即PDK4、STAT3、HCLS1和FKBP11)和4个下调基因(即GATM、ATPIF1、CPT1B和GJA1)已经被证明在病理性肥大中起重要作用。
HCM中NMGene的表达模式 表1 前10个上调和下调的DE-NMGene
下调的DE-NMGene比上调的DE-NMGene在功能上更加多样化使用DAVID工具对316个DE-NMGene进行了GO BP和KEGG通路富集分析。尽管上调和下调的DE-NMGene数目相似,但下调的DE-NMGene在功能上比上调的DE-NMGene更具多样性。通过设定BH校正后的p值<0.05,研究者获得了141个上调DE-NMGene的4个GO term和4个KEGG通路,以及175个下调DE-NMGene的16个GO term和17个KEGG通路(A,B)。在下调的DE-NMGene中,前3个富集GO term是“氧化还原过程”、“支链氨基酸分解代谢过程”和“脂肪酸β-氧化”。GO term“氧化还原过程”和“翻译”均富集在141个上调和175个下调的DE-NMGene中。KEGG通路富集分析显示,下调的DE-NMGene在“碳代谢”、“丙酮酸代谢”、“脂肪酸代谢”和“柠檬酸循环”等能量代谢相关通路中显著富集。对于上调的DE-NMGene,KEGG通路为“抗生素的生物合成”和“氨基酸的生物合成”。 141个上调DE-NMGene和175个下调DE-NMGene的GO和KEGG富集结果215个DE-NMGene构成的生物网络研究者对316个DE-NMGene进行了综合分析来构建PPI网络,通过使用STRING数据库获得了包含440个互作对和215个节点的PPI网络,为了获得高
置信度的结果,互作得分应大于0.7。因此,316个DE-NMGene中有215个被纳入最终的PPI网络(A)。316个DE-NMGene的互作明显多于从基因组中随机抽取一组相同大小的蛋白质的互作。在PPI网络中,高度连接的节点被称为关键节点,可能在理解疾病的生物学机制方面发挥重要作用。研究者计算了每个节点的度,并选择度排名在前5%的基因作为关键基因。在PPI网络的215个节点中,有13个节点排在前5%并被作为关键基因(表2)。DLD是度最大的关键基因,与PPI网络中的19个蛋白相互作用。表2 PPI网络中的hub基因
Cytoscape中的MCODE插件用于检测来自PPI网络的网络模块。模块是一组密切相关的蛋白质,它们通过PPI网络协同作用,执行特定的生物功能。从PPI网络中共挖掘了12个模块,其中5个模块(模块1- 5)节点≥5个(B)。模块1、模块2、模块4和模块5的相关生物学过程分别为“线粒体呼吸链复合体I组装”、“线粒体翻译”、“天冬酰胺介导的蛋白质N-连接糖基化”和“含叶酸化合物生物合成过程”,模块3中无GO term显著富集。 316个DE-NMGene的网络分析潜在调控DE-NMGene的TF在HCM中发挥关键作用iRegulon作为Cytoscape的插件,用于预测可能调控316个 DE-NMGene的TF。最终,总共获得了17个TF(NES> 3,FDR <0.001)(表3)。靶点最多的TF是PBX3,它调控了145个DE-NMGene。17个TF其中的8个,即BACH1,ATF3,XBP1,KLF4,MEF2C,JUND,MYC和YY1,已被证明在病理性肥大中起重要作用。表3 TF潜在调控316个DE-NMGene的表达
差异表达的NMGene在体内的验证为了在体内验证已识别的基因,从对照组和主动脉缩窄(TAC)小鼠中提取样本,以确定还未被证明在心肌肥厚中起重要作用的前5个基因的mRNA水平是否与
生物信息学分析一致。在TAC组中,MYH7、ANP和BNP表达水平升高(A-C),表明在小鼠TAC模型中压力负荷过度诱发了心肌肥厚。值得一提的是,与假手术组相比,小鼠TAC模型中DDIT4、TKT、CLIC1、DDOST和SNCA的表达均升高(D-H)。 差异表达的NMGene在TAC小鼠中的验证参考文献:Systemic Bioinformatic Analyses of Nuclear-Encoded Mitochondrial Genes in Hypertrophic Cardiomyopathy有生信相关问题联系:18501230653欢迎关注转录组| 甲基化 | 重测序 | 单细胞 | m6A|多组学 cytoscape | limma | WGCNA |水熊虫传奇|linux电泳 |
PCR | 测序简史 | 核型 | NIPT | 基础实验 基因| 2019-nCoV | 富集分析 | 联合分析 |微环境 瘟疫追凶| 思路汇总| 学者 | 科研 | 撤稿| 读博|工作