山羊相关文章解读

admin 12 2025-02-09 编辑

 

 天苍苍,野茫茫,风吹草低见牛羊

 

一、引子

大家好,16年三代组装了一个山羊的基因组,如果经常关注我们的童鞋,应该记得,小编的那个打油诗“二代准,三代长,光学Hi-C

装出大山羊”,山羊的基因组大小约为2.9Gb,利三代+光学+HiC之后,contig N50组装到了破天荒的10.858Mb,scaffold N50为87 Mb,并且直接挂在到了染色体水平。这篇新基因组的文章还没有看到,这里重点给大家介绍下基因组组装中测序技术的重要性。

首先做过基因组或者没有做过基因组的都清楚,物种的基因组测序是一个物种研究的开始,而这个物种基因组测序完整度和准确性会严重影响后续工作的开展。

最重要的指标是什么,就是N50和基因组完整度(不知道的看历史消息)

传统二代测序技术组装算法大多都是基于图论的思想,因此组装中遇到的最大的问题就是对于高重复和高杂合基因组,组装效果较差。有很多软件致力于用算法解决这些问题,比如Platanus 软件,还有前段时间刚发布的软件Redundans等。这些软件核心的原理其实就是减少杂合选择的情况。大家感兴趣的看历史消息。

二、三代测序技术介绍

杂合反映在debruijn图上是很多的bubble(如上图)。如果用小的kmer进行组装,则不能有效的确定bubble之间的连接路径,因此会出现连错或者直接组装中断的情况。使用super reads后,kmer可以放大,距离较近的bubble会被直接识别成一个长的bubble,直接任选一条路径,即可输出contig序列,而不会有杂合路径选错的问题。

也就是说长read 可以之间跨过杂合区域,然后就不存在杂合选择困难的问题啦,解决问题一步到位。还有就是三代测序技术牛叉在于单分子测序,对于高杂合,高重复,或者高GC,都一样,不存在任何偏好。

通过上面的介绍,可以知道三代测序技术可以显著的提升contig 组装水平。

举例:

红豆基因组三代测序技术组装结果较二代 contig水平提升了100倍。Gap较少了100倍。

另外红豆基因组中还用到了光学图谱。

 ‍

三、光学图谱介绍

光学图谱的作用其实是很简单的,作用类似于遗传图谱,他就是对整条基因组序列进行拍照,获取相应的位置,然后将contig连接在一起。

他目前的应有范围主要有:

1、提升scaffold组装水平。

2、挂在染色体(和遗传图一起,效果更好)。

山羊基因组中,利用光学图谱技术,得到的scaffold组装的N50水平13.408Mb。

四、Hi-C技术介绍

经常关注的童鞋,应该看过Hi-C原理的那篇文章。这里不赘述,Hi-C技术也是主要用于挂在染色体的,主要应用也是提高scaffold组装水平和挂载染色体,但是由于对样品要求较高,所以在国内应用的地方还是不多,但是由于其价格较为便宜,还是很有市场的。

山羊基因组中利用三代+光学+Hi-C得到的最终的结果scaffold 为87.347 Mb。

所以个人觉得如果真的想发高分,真的想得到好的基因组,还是得舍得投入,要不结果让人纠结死。

山羊相关文章解读

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 热点5:网络药理学反向GSEA
相关文章