首先给大家说下,其实对于我们而言,不区分医学还是农学的,都是数据,医学的主要是人和小鼠,农学研究的物种会多一些。
公众号起初一直是关注基因组、转录组等组学相关的知识,因为小编个人虽然医学出身,但是刚工作的时候是投身到了火热的基因组研究浪潮中。后来医学相关的公司,课题,项目多起来,小编才从三代+光学+Hi-C转回到医学研究上。
当初也在想公众号的定位,要不要区分开来,不要这么变态,脚踩医学,农学两条船。也有粉丝留言说我们是神经病公众号。
粉丝们说的对,研究人类疾病的医生和科研工作者肯定不会对固氮机制感兴趣,同样,研究大田作物的人,也不会对预后模型感兴趣。
貌似粉丝们说的意见,我可以采纳了。
但是对于而言,我们是一个技术号,是一个技术知识分享号,侧重的是生信知识和技术,不应该区分应用的领域。
说白了,我们卖的是刀,至于你买回家是杀鸡,还是切菜,这个与我们无关。
所以,我们可能会继续脚踩两只船的,神经质下去。
既然,逃脱不了神经质的命运,脚踩着两只船,也就会有一点点神经质的想法。
我一直在想,如果从技术上两者无差异,那么肯定在应用层面上,两者也会有相互学习或者相似的东西。
其实我现在还没有特别深的认识,分不清到底是医学向农学学习,还是农学向医学学习。
农学研究的还是比较粗糙,这也是它的优点,有什么牛叉的技术,完全可以提前试用,比如水稻完成图,比如高质量的山羊基因组。
医学研究相对保守的多,毕竟研究对象比较金贵,这也导致了某些程度上的进展要慢一点点。
两者还是有一些分析套路,不知道是谁借鉴的谁,大家有谁知道前因后果的,可以留言。
比如农学基因组上比较火的pan-genome(泛基因组) ,和医学上比较火的pan-cancer(泛癌)。
比如农学比较火有点烂大街的套路基因家族分析,在医学上也有影子。
再比如去年推广的发在cancer letter上的医学 AS分析,其实在农学上也是烂大街的套路。
但是
大家都知道的医学上套路三板斧:差异,降维,预后,我是没在农学上找到类似的文章。
所谓的三板斧,其实就是一种数理建模的思想。
为啥说农学上没有。因为农学做转录组,比如筛出2000个差异基因,它不会进一步的做回归降维去筛选,大不了,调整参数,再来一遍。这里缺少统计学的一点思想,至少我见过的公司是这样的。
随着数据的不断积累,物种的基因组水平慢慢的上升,数理模型在农学研究中的大量应用,应该是早晚的事情。
最近之所以会有这样的感慨,是因为看了一篇文章,大概的故事讲的是农学上,利用一些已有的数据,构建了一个很简单的回归模型,说明物种和宿主的负相关关系,然后利用这个模型来对未知进行指导。
这个文章就不跟大家多说了,另一个例子,我觉得是可以跟大家分享的。
之前推送过的一篇文章:N50多少,证明组装的好?
老外将测过的基因组大小的数据和基因平均长度的数据做了一个拟合。
如下图
通过这个图,在知道其基因组大小的情况下,可以大概的估计基因的平均长度。这就可以指导生产了,比如你测序的contig N90 应该要在多少以上,你PCR的时候,也知道这个基因大概的一个范围。
上面的例子,只是我知道的数理模型在农学中的一个简单应用,农学的数据也很多,肯定会有更多的模型出现。(有其他的应用的,欢迎留言)
目前大家看到的现状,应该是这样的:
农学拼命的测数据,数理模型应用的特别少,生信就像流浪的铁锹,这挖一挖,那刨一刨。
医学的很少测数据(套路的),数理模型遍地都是,生信就像轰炸机,把地犁来犁去。
当然,小编在跟客户沟通的时候,也会忽悠客户往类似三板斧上走,毕竟这有点牛叉的意味。
效果不是很好。
可能是因为没有经费支持,谁知道呢。
更多精彩内容,欢迎关注
一个物种一个家
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史