数据挖掘分析服务,最难的是什么,是数据。
所谓巧媳妇没有米也做不成饭,就是这个道理。
起初,小编还浪迹测序行业的时候,每每随销售出差拜访客户,大多询问,有什么收集好的样本,然后大吹特吹此样本的特殊和珍贵。
销售给我们技术支持打分评估,也多依赖于此。
对于一个做分析出身的产品经理,其实很多客户的样本相关的信息,或者实验设计都不完善,其样本的含金量并不是很高。
可以这么说,信息收集不完整的样本,称不上好样本。
测序可以认为是标准化的产品,包括附带的标准分析。
标准化,才能实现规模效应,才能实现博士谈客户,硕士写方案,本科生开发的盈利模式。(切勿对号入座)
当然这切的打破,还是源于青岛海洋所的一次拜访。
客户坦言,你们老是让我们测数据,测了一堆数据堆在这,也不知道如何分析,如何解读。
我觉得你们应该试试,如何帮助客户盘活存量数据。
说者无心,听者有意。
盘活存量数据。
对于做生信的来说,尤其是我们这种毕业于东北某医大的学生而言,数据是弥足珍贵的。
君不知道,哈某大,经费不充足到,学生喝水都要限制,所以我们的课题大多都是公开数据库挖掘的。
因为什么,因为穷。
所谓,穷且活好,不坠青云之志。
不吹不黑,咱们学校毕业的学生个性化生信分析,那绝对是牛X的。
毕竟是从数据的真空中爬过雪山,翻过草地。
有一点米,就能蒸出白白胖胖的大馒头。
盘活存量数据,一直在做的是,公开数据库的数据的二次挖掘。
为甚选择公开数据库,其实是因为信息收集的蛮多,是满足分析的,当然还有一个很大的问题,就是很多单位第一次挖掘,往往挖的不够深,给了饥肠辘辘的我们一个机会。
这其中存量数据中更多的转录组相关的数据。
为什么,因为价格便宜,数据量大,数据大,好掉头。
但是,又有转折了。跟很多客户沟通中才知道。
客户手里其实也有数据,这些数据五花八门,还有土炮呢。
比如一个客户在我们这做的是转录组的个性化,聊着聊着了解到有WES的数据,仔细一打听,样本量还很大,再聊细点呢,临床信息还很全。
听到这,我两眼都冒绿光啊。
这种感觉就像北京雾霾,只能去地铁里呼吸新鲜空气,突然扔到大西北,竟然醉氧了,不适应。
就像有一次让我们班长评估一个数据的临床信息表一样。
我们班长是有名的三好学生,目前唯一坚守在学校的砥柱。她(对,一个大美女)直接说,咱们辛辛苦苦挖来挖去的数据,还不知道能不能用,但是客户这边就有现成的,但是客户还不挖,哎。
说者有心,听者有意。
接下来,决定不拘泥于公开数据库的二次挖掘,对于客户的自测数据,首次或者N次的,我们都想看看有木有可以深入挖掘的东西。
比如对于转录组,几个样本的标准分析之后,可以套用的思路就有很多,核心基因,WGCNA、ceRNA、network&pathway、免疫评分、特定基因集、lncRNA分析、可变剪切等等等等,选择一个适合的就OK了。
所谓存量数据都是宝,方案套路不能少。
所以,如果各位老师手里有数据、有想法,或者有想法,没数据,或者只有样本,不管什么情况,欢迎你跟合作,我们这边给你免费定制生信挖掘的方案。
如果你觉得方案还不错,
愿意合作,我们再合作。
扫码填写需求,
我们会跟老师一一联系,设计免费分析挖掘方案。
提供原始数据、支持复现,
支持个性化添加,总有一款适合你
最后,感谢关注。