高通量测序知识分享—十一特别版(6)

admin 17 2025-01-28 编辑

43 PhiX文库有什么用?

PhiX文库是一种用病毒基因组做的文库。其基因序列已精确知晓,GC比例约为40%,与人类、哺乳类的基因组的GC比例接近。其基因序列又与人类的基因序列相去甚远,在与哺乳类基因组一些测序时,可以轻松地通过基因序列比对而将之去除。

在测四种碱基不平衡(A、G、C、T四种碱基的含量远远偏离25%)的样本时,可以加入大量的PhiX文库,以部分抵消样本的不平衡性。例如ChIPed DNA测序,或者亚硫酸氢盐处理过的DNA文库,或者扩增子测序(PCR样测序),都可以加入PhiX,以部分弥补碱基不平衡性。

也可以少量地加入样本,以作为control library来验证测序质量。

44 Hiseq和Miseq有什么差别?

Hiseq 2000的测序数据产量很高,一条Lane一次可以产生35G的Q30数据,一张Flowcell可以产生约300G的Q30数据。但是测一次序要9~11天的时间。所以较慢。

Hiseq 2500的一张PE 200 Flowcell可以给出60G的Q30数据,测序本身是一天时间,可以快速地以较高的通量给出高质量的测序数据。

Miseq的测序数据产量低,一次可以产生1G~4G的数据。但是测长可以做到较长,目前可以测250*2。而且测序的速度非常快,一般一天就可以测完一张Flowcell。

45 Hiseq 2000和Hiseq 2500有什么差别?

仪器升级:

Hiseq 2500是Hiseq 2000的升级版。

其主要的改进点是:Hiseq 2500可以在快速、高通量两种模式之间切换。高通量模式就是原来的Hiseq 2000的每张Flowcell有8个Lane的模式。

Hiseq 2500的快速模式,核心的改进是用2个Lane的Flowcell来测序,而且这种快速Flowcell的Lane比Hiseq 2000的Lane要短,数据产量也略低于高通量模式的2条Lane。

Hiseq 2500快速模式的试剂也有所改进。

速度提升:

Hiseq高通量模式,PE100,双Flowcell,11天完成测序。数据量每Flowcell在270G PF data以上。

Hiseq快速模式,PE100,双Flowcel,27小时完成测序。数据量每Flowcell在60G PF data以上。

数据质量提升:

在快速模式下,Hiseq机器可以更快地拍完一个cycle的所有照片,也就是每个cycle的用时更少。SR50可以在1天内走完,PE100可以在2天内走完。这明显比原来的3天(SR50)、11天(PE100)要快得多。

在速度加快的同时,还带来质量的提升。因为Hiseq测序过程中两个主要的物质:酶和荧光剂都是不稳定的,或者说是在融化后(原来是冰冻的)随时间延长而不断降解的。为此Hiseq还为试剂准备了4度冰格,以减慢其降解。原来的Hiseq 2000要走11天,现在2天完成,这带来了明显的测序质量提升。

实测哺乳类动物的基因组DNA文库, Q30比例可达85%以上,而且其中绝大部分是90%以上。

测序长度提升:

而且因为测序质量的提升,也带动测序长度的提升,目前Illumina官方支持的Hiseq 2500的测长是PE 2*150。

特别需要注意的,Illumina目前不直接提供PE150的试剂,客户要用1*PE Cluster kit + 1*PE100 SBS kit + 2*SR50 SBS kit合起来,才能测PE150。

直接兼容更多文库:

Hiseq 2500的快速模式试剂直接支持双Index测序模式:

双Index是指两个接头各有一个Index。这样两套Index排列组合,一个Lane里可以放更多的文库。目前Illumina官方试剂是支持96个排列组合( 12*8 = 96),这对充分利用Hiseq平台巨大的测序数据产量有很大的帮助。原来的单Index是支持单侧24种Index。

这与Hiseq PE100高通量模式标准PE100试剂只能测单Index。当然,Hiseq2000b也可以测双Index,但是用4个50 cycles SBS kit(每Kit保证58个cycles)拼起来(58*4=232),才可以保证有足够的SBS试剂量,因为双Index会实际需要216 cycles,这超过了200 cycle SBS试剂可以保证的cycle数。

仪器操作更方便:

Hiseq 2500快速模式可以直接在Hiseq仪上进行Cluster生成,这大大节约了先要在cBOT上生成Cluster,再要将Flowcell从cBOT上移到Hiseq的麻烦。

但是请注意,如果直接在Hiseq 2500上生成cluster,两条Lane就只能上一种预混合文库,而不能象原来的Hiseq 2000上那样,两条Lane物理分开。也就是说预混合文库中的Index一定是要分得开的才行。

当然,快速模式也可以还用cBOT生成cluster,但是那要另外买一个编号为CT-402-4001(全名:TruSeq® Rapid Duo cBot™ Sample Loading Kit )的试剂盒,这个试剂盒要好几百美元。

试剂操作更方便 :

Hiseq 2500快速模式的试剂是做成Master Mix的,也就是酶、Buffer、荧光dNTP等都预先混合好了,一大管,拿来一化冻就可以用,很方便。这与高通量模式试剂把酶、荧光dNTP分几管的模式是不一样的,高通量模式的试剂因为是分管的,所以使用之前还要人工再混合,这样会多占用一点人工。

Hiseq 2500的两个机位同时只能运行一种模式:

Hiseq 2500在一台机器的两个机位同时只能跑同一种模式,也就是要么都跑快速模式,要么都跑高通量模式,而不能一个机位跑快速模式,另一个机位同时跑高通量模式。

可以用这个来理解4000。

高通量测序知识分享—十一特别版(6)

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: RCricos绘制简单圈图
相关文章