Hi-C挂载染色体原理大起底-通俗版

admin 46 2025-03-27 15:49:08 编辑

最近Hi-C技术十分火热,国内很多公司都引入了Hi-C技术,根本原因在于他能显著的提升组装水平,对于将scaffold挂载到染色体,更是比遗传图好很多。今天我在这里大概的讲解下Hi-C的技术和挂载原理。

什么是Hi-C

Hi-C技术是起源于3C技术,染色体构体捕获技术(Chromosome Conformation Capture, 开头字母3个C)这种技术本来利用与染色质构像分析,但是慢慢的变成了细胞内染色质相互作用的研究技术。

然后从3C技术中构建Hi-C技术的基础可以是:

1、染色质之间的互做只发生在染色质内。

2、距离越远,发生互做的可能性越小。

Hi-C挂载染色体,就是利用3维情况下的互做,指导二维基因组组装的一种应用。

Hi-C辅助组装原理

通过上图可以清楚的了解到,所谓的染色体序列在二维上物理距离很远,但是3维空间上很近(互做)。如果我们能够按照空间距离测序,可以获得非常长的marker店,这样就可以将scaffold组装的更长。

实验的设计原理如下

1、首先是利用某种试剂将有互做的位置固定

2、然后利用酶切割,然后加上可以被识别的接头

3、进行环化

4、切割,然后识别有接头的序列,进行两端测序。这样一对read中间的插入片段真的就是超级长。

组装原理

得到Hi-C的read之后,可以利用read和contig(scaffold)之间的比对情况,将序列链接起来。

具体的流程图如下:

1、利用发生互做的只在同一条染色质内,可以将不同的序列进行分类

2、然后在组内,根据互做的情况,对contigs进行排序。

3、(重点)虽然2中对contigs排了序,但是congtigs得具体方向还是没有办法确定。可以利用的信息:二代测序的read的方向。彼此之间互做频率的情况等。第三步这里利用的算法是:仍然基于距离远,互做关系就少的原则。

对所有的congtigs的方向都进行考虑,然后给予一个打分(对数似然分数),选择一种分数最高的。最适合(最长,最完整)。~~~~~~(是不是动态规划可以更好的解决这个问题)


欢迎关注

上一篇: 基因设计工具的十大推荐,让你的科研事半功倍
下一篇: NGS一网打尽的网站
相关文章