单纯测完单细胞就能发高分文章的时代已经远去了,但是单细胞数据挖掘的时代才刚刚到来。毕竟随着大量单细胞测序文章的发表,公共数据库的单细胞数据已经积累到令人发指的程度了。从前几天为大家整理的单细胞数据库汇总就能发现,整合单细胞测序数据的数据库都已经到了只能收藏不能背下来的程度了。相对来说,非肿瘤疾病的数据是没有肿瘤数据丰富的;不像TCGA,发1-10分都绰绰有余。不过,单细胞数据库都已经收藏了,那么有没有合适的路子能够用上这些数据呢?答案是肯定的,小编这就通过一篇7分文章为大家介绍非肿瘤疾病单细胞+bulk RNA-seq数据的经典搭配。
文章21年十一月份发表在Frontiers in Immunology(IF: 7.561)。
Expression of Immune Related Genes and Possible Regulatory Mechanisms in Alzheimer’s Disease
![助力非肿瘤疾病研究:万能7+单细胞联合bulk数据思路](https://www.yanyin.tech/cms/manage/file/51.jpg)
阿尔兹海默症免疫相关基因的表达和潜在调控机制
摘要:
阿尔兹海默症(Alzheimer’s disease, AD)作为最常见的进行性痴呆,其特点是记忆衰退和严重残疾。最近,越来越多的研究表明神经炎症和组织驻留的免疫细胞是AD发病的关键因素。
已有研究表明外周免疫细胞与中枢神经具有强烈的相互作用。免疫相关基因在免疫浸润中发挥重要作用;然而,AD中免疫基因的表达特征和可能机制还不清楚。
材料方法:
来自GEO数据库的一套AD PBMC单细胞RNA sequencing数据作为训练集,一套小鼠NK细胞单细胞数据作为验证集;来自GEO数据库的一套AD大脑bulk RNA-seq数据;免疫相关基因来自ImmPort;常规单细胞分析流程,AUCell评估基因集活性;功能富集;PPI网络。
结果:
1.AD中PBMC单细胞表达谱
很常规的单细胞前期分析结果,例如基因、count、线粒体基因,相关性,DEG热图,其次是细胞cluster与注释。从结果可以看到,与对照样本相比,NK细胞显著减少,因此后续分析聚焦NK细胞。
2.AD中PBMC细胞cluster的IRG score
为了研究IRG在AD中的表达特征,首先筛选cluster差异的IRG,采用AUCell构建IRG活性得分,以AUC value的形式展示在不同细胞类型的分布。从结果可以看到,在阈值0.26的情况下,NK细胞和DC细胞的AUC更高。NK细胞也与前一个结果能衔接上,因此,针对NK细胞采用GO和KEGG探索细胞亚群功能。
3.AD大脑bulk RNA-seq差异表达基因
为了探索AD大脑组织表达特征,采用来自大脑前额叶组织的芯片数据进行差异表达分析和差异基因功能富集分析。从结果可以看到,与NK细胞富集结果相似,都聚焦在免疫反应。
4.共有IRG和相关的调控转录因子
由于NK cluster和大脑组织的差异基因都富集到免疫反应,因此接下来研究两者共有的IRG。共识别到70个common IRG。
为了研究common IRG的转录调控活性,从HumanTFDB获取common IRG的1665TF,17个TF属于NK cluster和大脑组织差异基因。TF PPI network识别STAT3可能作为关键因子对IRG进行转录调控。
5.AD大脑中验证NK浸润
总结:
全文整体来看,逻辑紧密,思路也非常清晰。巧妙的结合了免疫基因、scRNA-seq和bulk RNA-seq;对于文章的中心也非常好把握,某某转录因子通过调控关键免疫基因在某细胞类型中发生紊乱,导致了疾病进展,不太可能出现结果乱七八糟完全不知道重点在哪的情况。此外,如果只基于公共数据来做,也有很多可以更换和拓展的地方,例如完全可以研究炎性基因、干扰素等基因,甚至被人抢发的热点基因集例如铁死亡、缺氧等等;对于有实验条件的情况,完全可以去掉当前文章的验证部分,选择一到两个结果对细胞和基因进行验证,可以轻松提升文章水平。