2018年10月8日,福建农林大学基因组与生物技术研究中心明瑞光教授团队在国际权威期刊《Nature Genetics》在线发表题为“Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.”的研究论文。基因组中心张积森教授,张兴坦副教授,唐海宝教授,博士生张清为论文共同第一作者,明瑞光教授为论文通讯作者,福建农林大学为论文第一作者单位及通讯单位。该论文为全球首次公布甘蔗基因组,这是第二个以中国人为主破译的大宗农作物基因组,是全球第一个组装到染色体水平的同源多倍体基因组,标志着全球农作物基础生物学研究取得重大突破,奠定了我国在甘蔗研究领域的国际领先地位。
一、组装策略
1. 35,156 BAC clones,组装软件ALLPATH-LG8 , SPAdes9 和SOAPdenovo,组装结果2.56 Gbp assembly,contig N50 7.4 kb
2. 295 Gbp PacBio RS II三代数据,组装软件CANU,外加BAC数据产生3.13 Gbp 基因组, contig N50 45 kb 。
3. 1 billion of 150 bp PE Hi-C 数据,组装软件ALLHIC,产生32 pseudo-chromosomes, 挂载染色体上基因组序列达 2.9 Gbp,包含97% 的基因。
二、组装评估
1. 热图
2.与高粱共线性。
3.遗传图: 89% contigs与Hi-C一致。
4.CEGMA: 219 (88.3 %) CEGs完整。
5. BUSCO:1,397 (97.01 %) 完整。
6.二代数据回比:1,624 144 million (97.01%) 二代数据覆盖 97.3 %基因组。
三、注释
1. two rounds of MAKER注释流程,获得 35,525基因,包括 4,289 (12.7%) genes with four alleles, 154 9,792 (27.6%) with three, 14,797 (41.7%) with two, and 6,647 (18.7%) with one.90.0% 注释的基因可以在高粱中找到。
2. 58.65 % 基因组是TE。
四、染色体数目降低与多倍化
甘蔗由10 变成 8 条原因是经历一些染色体重组。
四套A, B, C and D 比较,鉴定了 7.7 million SNPs, 1.03 million short indels and 3,637 SVs
五、基因差异表达
探讨四套同源基因组上基因表达的差异。 提取了4,289 个高度共线性的基因集,分析基因表达特征,结果显示不存在chromosome dominance(Supplementary Figure 9).
有生信分析请留言
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史