张晓艳课题组建立病毒突变、整合及顺式效应数据库ViMIC——用于病毒介导的发病机制研究
2021年9月,同济大学生命科学与技术院张晓艳课题组在Nucleic Acids Research(中科院JCR分区1区,IF=16.971)杂志上发表文章ViMIC: a database of human disease-related virus mutations, integration sites and cis-effects,建立了病毒突变、整合及顺式效应数据库ViMIC。
病毒的发病机制十分复杂,涉及与宿主相互作用的多个方面。研究表明,病毒可以通过将其基因组整合到人类染色体中来发挥顺式效应。病毒区域或基因突变也可能增加疾病进展和耐药性的风险。此外,某些病毒突变可能通过增加或减少病毒DNA整合到宿主细胞的发生率,在促进疾病发生方面发挥重要作用。目前,PubMed上有数百万篇与病毒相关的研究,也已有相关的数据库收集相关信息,如病毒整合站点数据库VISDB、Dr.VIS、RID和ISDB,然而现有的数据库没有包含对公共资源中病毒突变和病毒整合位点进行综合、标准化和功能上的注释。因此,如何快速浏览、可视化和利用已有的知识来研究病毒与宿主之间的相互作用,是研究人员面临的挑战。
目前为止,ViMIC数据库从Pubmed、Cistrome data Browser、VISDB、NCBI Nucleotide和GEO数据库收集了涵盖了77种人类疾病的8种病毒信息,包括31,712个病毒突变条目、105,624个整合位点、16,310个病毒靶基因和1,110,015条病毒序列信息。同时,ViMIC可通过组蛋白修饰、转录因子结合与病毒整合位点上的染色质可及性来探索病毒-宿主相互作用的顺式效应,共包括了78个组蛋白修饰和1,358个转录调控因子的结合位点(表1)。
表 1
ViMIC包含三个主要模块:病毒突变位点模块(virus mutation site)、病毒整合位点模块(viral integration site)和靶基因模块(target gene)。病毒突变位点模块包括突变位点注释和序列信息统计。对每一个病毒突变位点,ViMIC提供了突变水平、病毒基因/蛋白/区域、病毒相关疾病、基因型/亚型、是否免疫逃逸/耐药、文献支持证据等注释信息。病毒整合位点模块对病毒整合片段-Cistrome因子的重叠数进行了计算,用于探索病毒整合位点是否参与宿主基因组的一个功能区域。对于每个病毒整合片段,如果与Cistrome因子存在重叠(重叠总和>0),ViMIC将给出详细的结果,包括重叠数和每个Cistrome样本相应的GSMID、细胞系、细胞类型、组织类型和因子名称的注释。ViMIC使用热图和直方图统计了人类染色体上所有的病毒整合位点和Cistrome因子的重叠情况。靶基因模块提供了病毒插入或受病毒基因/蛋白质/区域影响的靶基因信息,包括基因名、全名、别名、转录本、基因类型、基因位置信息、基因功能、基因id和相关药物等信息。对于每个基因,ViMIC收集了部分病毒相关疾病患者的基因表达数据,可查看其表达与免疫细胞浸润的关系。为ViMIC数据库的示意图概述。
图 1
在病毒突变界面首页,用户通过选择任何感兴趣的病毒突变数,可查看该病毒目前报道的所有致病突变,进一步选择病毒基因或者疾病,可以查看该病毒基因或疾病相关的突变。
以HBV为例,用户可在病毒突变概览页面中单击带有HBV VM编号的绿色按钮,如A所示。ViMIC将返回一个包含人工校对的HBV突变位点信息的表格。用户可按基因/蛋白质/区域或疾病筛选突变,并在表格右上角的搜索框中输入关键词,点击View按钮查看搜索到的突变详细信息。
此外,用户可以单击Sequence按钮浏览来自全球不同地区的HBV基因组序列的统计数据。病毒突变模块将帮助用户获得HBV相关的进展,并快速查找感兴趣的突变。
在病毒整合界面首页,假设用户希望获得一个VIS条目的详细因素列表,用户可按照B中的步骤进行操作。
以HBV第5号染色体的1000606条目为例,用户点击chr5并搜索1000606条目后,ViMIC将显示该VIS与三类Cistrome因子的重叠结果。通过单击TFBS(转录因子结合位点)列中带有数字的绿色按钮并过滤生物来源,ViMIC显示了与该VIS重叠的16个转录调节因子的排名。然后,用户可通过点击转录因子MYC的View按钮查看Cistrome样本,可发现三个样本在5号染色体的位置(坐标:1295020,hg38)显示了1000606和MYC之间的重叠。如果用户想观察VIS 1000606中是否存在突变,可点击View VIS-VM association按钮,在Mutation和Sequence面板中快速搜索DVID获取关联信息。
此外,用户还可以在HBV的整合菜单中选择chr5来查看5号染色体上三个因子和病毒整合片段的重叠分布。也可选择因子浏览菜单来查看HBV VIS和MYC之间的所有重叠条目(B)。由于TERT是VIS 1000606的靶基因,在病毒靶基因页面,ViMIC还提供了基于CIBERSORT的TERT基因表达与22种免疫细胞之间的免疫分析。TERT的详细信息页面显示了HBV感染疾病的热图和相关分析结果以及TERT基因的详细信息,TERT基因表达分析结果进一步显示与HBV+样本中CD8+T细胞呈正相关趋势(C)。
图 2
ViMIC是一个综合的人类疾病相关病毒的资源。该数据库界面简洁友好,允许用户快速查询病毒突变、VIS-Cistrome相互作用、病毒序列、病毒感染性疾病中VIS-VM相关性及免疫细胞浸润水平与受整合事件或病毒基因/区域/蛋白影响的基因表达的相关性,有助于病毒致病机制的探索。
同济大学生命科学与技术院张晓艳教授为该论文通讯作者,上海东方肝胆外科医院实验诊断科王颖博士、同济大学生命科学与技术院博士童袁桃、张泽宇为共同第一作者。
原文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab779/6368050