老师,我想学多组学整合

admin 59 2024-12-24 编辑

实现多组学整合一直是从事组学数据研究旁友(嗯也就是我)心中的梦想。

一方面,从梦幻的层面来说基因组、转录组、蛋白组和代谢组的整合,可以多层次解释你的数据,为全面了解生物系统和机制提供帮助;另一方面,从现实的层面来说,可以让你的文章逼格飙升,影响因子窜一档。

 

 

 

我不知道大家组里会不会有一些入组必读、行业标杆,反正在我们组有三篇文章被立为金刚标杆。它们都是CPTAC(Clinical Proteomic Tumor Analysis Consortium)出的文章,一篇是结直肠癌(Nature,2014),一篇是乳腺癌(Nature, 2016),还有一篇是卵巢癌(Cell,2016),主要做的东西是蛋白组数据辅助肿瘤分型,从而更好地为不同亚型病人精准医疗。

 

我们亲切地称它们为“结直肠癌那篇”、“乳腺癌那篇”和“卵巢癌那篇”。

那么为什么这三篇文章能发这么高呢?除了大佬加持,样本量大,数据质量可靠,癌症分型的必要性等我也数不过来的优势外……文章的有一部分的亮点还在于他们将病人的转录组和基因组的数据(病人都是TCGA中的样本)都用作蛋白数据分析的辅助,大大提高了整篇文章的丰富性!

 

 

针对其中组学纠缠的例子我进行了下整理,有兴趣的可以自己看文章哈:

 

基因组+转录组:CNA(copy number alterations,拷贝数变异)与mRNA丰度的相关性(结、乳);

基因组+蛋白组:CNA与蛋白丰度的相关性(三篇);CIN(染色体不稳定性)与蛋白丰度的关系(卵);

转录组+蛋白组:mRNA与蛋白丰度的相关性(结,卵);

非纠缠部分主要还是蛋白组的分析,包括蛋白质的定量、聚类和亚型分类、磷酸化组等研究。

组学整合方面约占所有篇幅的1/3不到一点,相当于基本旋律是唱蛋白组的歌,还有几小段基因组和转录组的和声。

最近,国家蛋白质组研究中心出了一篇胃癌的蛋白组分析文章,发了Nature Communication。主要走的也是CPTAC的套路,但是因为数据有所差别(没有mRNA数据,有外显子测序数据,并且有癌与癌旁的对照加持),所以故事也会有一点不太一样。但是仔细看一下,多组学整合的方面也一样做了很多,比如基因突变与蛋白表达量的相关性。

 

以上主要是蛋白组方面的例子。另外还有比如有人结合基因组、转录组数据来寻找新基因的,有结合代谢组、转录组数据来发现基因功能的等等,丰富多彩。

其实不难发现,多组学整合主要有两方面:一个是用其他组学的数据来验证你所做组学的结果(比如用转录组验证新基因的存在),另一个是观察多组学间的相互关系(比如基因的突变对蛋白丰度的影响),目的性的不一样也决定了你的使用方法。

然后就是,多组学整合要求研究者对于各个组学的数据的性质和特点都有所了解,想一想铁人三项。

最后希望每个做组学的旁友都拥有一双多组学整合的翅膀,感恩。

 

文中提及的参考文章如下:

结直肠癌那篇:Zhang B, Wang J, Wang X, et al. Proteogenomic characterization of human colon and rectal cancer[J]. Nature, 2014, 513(7518): 382.

乳腺癌那篇:Mertins P, Mani D R, Ruggles K V, et al. Proteogenomics connects somatic mutations to signalling in breast cancer[J]. Nature, 2016, 534(7605): 55.

卵巢癌那篇:Zhang H, Liu T, Zhang Z, et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer[J]. Cell, 2016, 166(3): 755-765.

国家蛋白质组研究中心:Ge S, Xia X, Ding C, et al. A proteomic landscape of diffuse-type gastric cancer[J]. Nature communications, 2018, 9(1): 1012.

一个物种一个家

TCGA | 小工具 | 数据库 |组装| 注释 |   基因家族  |  Pvalue

基因预测  |bestorf |  sci | NAR | 在线工具 | 生存分析 | 热图

 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos

 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 |  进化 | 测序简史

老师,我想学多组学整合

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 结构生物信息学系列之分子对接(二)
相关文章