计算机系和生物系:我们的生信不一样?

admin 23 2025-01-24 编辑

其实仔细了解下可以发现,做生物信息的人很多!各种分布在生物系、计算机系、数学系甚至还有物理系等,所关注的方向也是五花八门,可以说这就是交叉学科的特点吧。(有没有感觉找到了很多同盟的感觉……)

二专毕设的时候,我被分配到了一位计算机系的老师那里,课题是多肽质谱相关。这位老师是机器学习出生,所以我主要做的内容就是通过一些统计分析和机器学习的方法来找一些癌症的生物标记物。虽然当时比较水,但是还是多多少少了解了一些思维方法和算法应用。

 

后来开始跟着生物系的导师做项目。Amazing,我发现导师做的蜜汁巧合的也是多肽质谱相关,甚至有一部分也是找生物标记物!天真的我以为可以愉快地套上以前的方法,再愉快地套上以前的脚本,顺利毕业,走上人生巅峰……然而我发现嗯我真的想太多了……

真的生物系和计算机系的生信研究方法还是差很多的啊!!主要如下:

计算机系的老师是这样想的,嗯我要先把质谱信息转化成二维坐标的信息,然后用各种算法来查找哪些坐标点(也就是特征)可以将正常人群和癌症人群更好地区分开,这些坐标点所代表的蛋白很重要,拿出来看一下真的在正常人群和癌症人群中的丰度值差很多诶,妥妥可以作为生物标记物啦~~所以大家就主要再想怎么优化去噪方法,遗传算法还是人工神经网络效果比较好啊,分类器选SVM行不行……主要就是我怎么才能把两类人群的错分率降到最低?

 

生物系老师则是这样想的,嗯质谱的话通过搜库的方法就能拿到蛋白的表达量啦,也就是说可以拿到每个人的不同蛋白的表达量了,嗯两类人群间做个t检验,卡个fold-change,就可以找到比较靠谱的差异表达蛋白啦,这些蛋白可以来个通路富集分析嘛。我还可以做做不同亚型的特征蛋白……所以大家就在想我要用什么Maxquant还是X!tandem搜库,小值填充怎么处理,通路富集结果我要怎么解释……主要就是我要怎么最大化它的生物学意义?

 

然后就是通过交流,我发现两位老师对彼此的方法好像都没什么了解,关注的文献也差别很大……

仔细想了其实不难了解,大约就是专业的不同导致两位老师的从问题出发的理念不同,她们都更倾向于把问题朝自己熟悉的领域带。计算机系的老师熟悉机器学习等算法,所以她会把问题本身总结成一个特征选择和分类的问题;而生物系的老师更喜欢把问题先转化成生物学意义的存在,尽量把生物学故事讲得逻辑清晰、有理有据。(所以不要吵架,都是小仙女!)

其实其他例子还有很多。大家不妨可以找一找,我个人感觉就是:计算机系的生信一般都会专注于算法,把结果做得很好看,对于提升性能这一点非常执着;生物系的生信一般都会很重视生物学意义,从头到尾逻辑清晰,故事讲得很漂亮。

其实我觉得不妨各个专业的可以多沟通交流,多了解下彼此的研究模式,说不定可以找到新的突破呢,从此顺利毕业走上人生巅峰!

欢迎关注

点击以下「关键词」,查看往期内容:

一个物种一个家

TCGA | 小工具 | 数据库 |组装| 注释 |   基因家族  |  Pvalue

基因预测  |bestorf |  sci | NAR | 在线工具 | 生存分析 | 热图

 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos

 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 |  进化 | 测序简史

计算机系和生物系:我们的生信不一样?

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 世界杯越来越冷,这个套路却持续火热~~
相关文章