新鲜热乎的10+生信思路确定不来看看?

admin 76 2024-12-25 编辑

新鲜热乎的10+生信思路确定不来看看?

都2021年了,想必新鲜热乎的10+生信思路也不好找了。其实不然,只要有足够的数据量,就没有生信玩不转的。当然,小编此次要分享的这篇文章主要卖点是自己测的几百例临床样本,但全文主要内容还是一系列生信分析所产生的结果。接下来小编就给大家解读一下这个高分生信思路,文末有彩蛋哦。

文章篇名为“Integration of genomic and transcriptomic markers improves the prognosis prediction of acute promyelocytic leukemia”,发表在Clin Cancer Res杂志上,目前影响因子为10.1,估计明年还会涨。其实用生信思路发文章主要靠的就是一个字:新。别人做不了的就是新;别人都是旧的思路,你另辟蹊径就是新;还有就是物以稀为新。呐,这篇文章做的是早幼粒白血病,而不是什么常见的乳腺癌,肝癌之类。就目前从GEO上也找不到多少可用的早幼粒白血病的数据。还有比较新的是思路,结合多指标将患者进行分组,从而进行比较,下面小编就仔细说来。

这篇文章主图就五张主图,但是附图和附表有很多,因为文章在四月底才online,所以现在还下载不到附图和附表,下面就以主图的行文逻辑进行展开说明。

                                                                                             

Figure 1没有提供什么特别的信息,就是做了个流程图。其实现在很多编辑都喜欢看流程图,因为这样很直观明了的了解文章的整体框架,所以我们经常看到三大刊也不乏流程图的存在。

小编觉得这个流程图虽然很简洁,但不是很美观,有点像2,3分水文的流程图,可能后期会修饰。高水平的期刊一般对图的要求更高,不仅清晰度,还有配色等,都要符合美的标准。发文章就像嫁闺女,不仅得将其打扮的漂漂亮亮,还得配上好嫁妆才能嫁入豪门。好啦,貌似有点说跑偏了,咱们继续解读。

       

从篇名我们也可以看出作者是分别做了基因组和转录组的联合分析。转录组我们都知道是RNA-seq;而测基因组常用的是WES,WGS,作者两种方法都用了。通过基因组测序,就能清楚的了解到哪些基因出现了什么变化,如各种突变。也正是这种突变导致了该基因无法行使原本正常的功能,对于肿瘤患者来说,基因突变不仅是肿瘤产生的主要驱动因素还是赋予肿瘤转移等特征的重要影响因素。因此,通过基因组测序,作者发现了一些在APL(急性早幼粒白血病)患者高度突变的基因,并发现NRAS这个基因突变可以单独显著的影响患者的OS,EFS,和DFS。因此NRAS的突变情况也作为后续构建模型的主要考虑因素之一。当然,还有其它基因的突变会影响患者生存,作者只是稍微提了一下,并没有过多介绍。

                                                                                                         

这一张图看着挺吓人的,其实很简单,作者就是根据ATRA(反式维甲酸)治疗前后差异表达的389基因将患者分为两组,然后看一些重要临床指标在两组患者的分布情况。接着就是用这些差异基因做了富集分析,并发现cluster A的基因主要和红系细胞的稳态和分化功能有关;cluster B的基因主要和T细胞的活化功能相关。并从中发现一个重要的转录因子:GATA1,其和APL患者的Sanz得分、白细胞计数、血小板计数都有关。接下来作者就构建了包括GATA1在内的共9个基因的一个特征基因集:APL9。

                                                                                                                       

在上一步研究中作者构建了APL9这个特征基因集,那么接下来就需要用这个基因集搞点事情。A图作者是看了这九个基因在患者中的表达情况,并构建了LASSO模型,赋予每个基因一个系数,最后对每位患者根据基因表达情况进行打分后并分为两组。这里需要注意的是取得cutoff值不是我们熟悉的中位值或者平均值,而是通过计算出来的值(0.58)。给我们一个思考就是,大家在具体分析自己的数据时,大可不必循规蹈矩的走固定路线,完全可以根据具体情况设置分组的cutoff值,并且可以尝试多个,因为没有任何规定限制这个值一定是平均值或中位值。

                                                                                                           

最开始作者先分析了基因突变,发现NRAS这个基因的突变对患者影响最大,然后构建了特征基因集APL9。此外,之前对APL患者进行分类主要用的是WBS(白细胞计数),那么接下来就顺理成章的将这些指标结合起来对患者分类,是不是就综合了多项因素,有更好的效果呢。于是作者整合了这些分类指标,将患者分为HR、SR(standard-risk)两组,AUC值证明这种分组在OS、EFS、DFS表现都有很好的效果;同时两组的生存分析结果也呈现巨大差异,从而证实了这种分类的可用性和可靠性。

这篇文章前面做的都很好,就是落脚点有点普通,用的是古老的配方,有点中气不足的感觉。如果最后用的是最近大火的机器学习的方法或者联合免疫分型对主要结果进行升华,估计就能发表更高水平的杂志。

彩蛋来了:

目前这篇文章的RNA-seq数据已经上传到GEO(GSE172057)上了,如果有研究白血病的小伙伴有福了,此外还有配套的基因突变数据,完全可以用这些高突变的基因和最影响患者生存的基因取交集,就可以走单基因分析套路啦;

另外,这篇文章主要是根据高突变基因信息对患者进行分型,说到分型,那不得不说的现在做的很多的就是免疫分型,大家可以用免疫细胞定量工具对其进行细胞定量,然后根据这项结果进行免疫分型,就又是一个不错的思路;

在作者第二幅图中,作者发现很多在APL中突变的基因,然而只研究了最为重要的NRAS。那么剩下的那些突变并且可以影响患者生存的基因,也是很有研究价值的,可以从里面挑选几个基因做一篇小文章还是绰绰有余的。

其实这篇文章因为很新,没有下载到补充图和表,在解读时会漏掉一部分信息(大家可以理解为本着最快最强的理念即时分享最新的文章思路,哈哈),但是不影响对整篇文章的理解。如果有临床样本资源的同志完全可以用这个思路换个癌种同样也能发一篇高分文章,没有资源的可以根据小编提供的彩蛋弥补缺憾。同时,希望有想法或有临床样本而不知道如何做的同志请联系,我们有最专业的生信服务团队,能为您提供最好的生信分析支持。

新鲜热乎的10+生信思路确定不来看看?

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 如何快速掌握TCGA数据库?推荐一个快速易上手的!
相关文章