今天给大家介绍一个功能强大的数据库,先贴上网址http://bioinfo.life.hust.edu.cn/EVAtlas。该数据库针对细胞外囊泡(EVs)中的非编码 RNA,有四个强大的功能:①浏览并比较24种条件和8种来源(血浆、血清、唾液、尿液、精子、母乳、原代细胞和细胞系)的EV中ncRNAs的分布;②根据条件相关组织中候选ncRNAs的表达情况,对其进行优先排序;③探索 24 种条件下 EV 中特异性表达的 ncRNA;④研究 ncRNA 功能、相关药物、靶基因和 EVs 分离方法。
导读
活细胞释放的细胞外囊泡(EVs)是信号转导和细胞通讯的重要载体,尤其是远距离细胞之间的相互作用。从内体系统分泌的外泌体和从质膜脱落的微泡 (MVs)是 EVs 的两个主要来源。EVs的内容物包括来自源细胞的多种生物分子,如脂质、蛋白质、代谢物、DNA和RNA。非编码 RNA (ncRNA) 是 EVs 中经过充分研究的重要分子,可以传递到和调节靶细胞,并显示出生理和病理特异性,可作为候选生物标志物。ncRNA作为重要的调控成分在生物过程中发挥着至关重要的作用,其表达谱在正常和疾病状态下差异很大。 例如,微小RNA(miRNA)、小核仁RNA(snoRNA)和转移RNA(tRNA)的失调是肿瘤发生中的常见事件。
在EVAtlas综合数据库中,研究者对2030 个 EVs smRNA-seq 数据集(1506 sEV和524 lEV数据集)的7种ncRNA(miRNA、snRNA、piRNA、snRNA、rRNA、tRNA和Y RNA)在24种条件和40多种疾病中的表达进行了整理和分析,并为在不同EV类型中的ncRNA提供了功能注释和特异性表达分析。目前,EVAtlas是EV ncRNA表达最全面的资源,已成为该领域研究的关键资源。
EVAtlas数据收集和处理
1、数据收集
研究者使用关键字“((extracellular vesicle OR exosome OR microvesicle OR EV)AND(smRNA-seq OR miRNA-seq OR small RNA-seq))AND”从NCBI GEO和SRA数据库检索人类EV相关smRNA-seq数据集。然后,手动审查研究设计或相关论文,根据确切的 EV 大小或类型描述用 sEV 或 IEV 标记每个数据集。用于区分特定样本(sEV或IEV)归属的标准如下:
① 具有明确归属定义的样本服从于原始样本;;
② 详细描述分离方法的样品符合国际细胞外囊泡学会(ISEV)的标准;
③ 商业试剂盒提取的样品按照制造商的介绍进行分类;
④ 根据“exosomes”或“microvesicles”的词频计数,将上述类别中的样本定义为sEVs或leVs;不能分组的样品被丢弃。
2、数据预处理
FastQC(v0.11.5)用于原始数据的质量控制(QC),trimmomatic(v0.36)用于适配器移除和低质量数据修整,以获得用于进一步分析的高质量清洁读数。 Bowtie(v1.2.1)用于将干净读数与人类参考基因组 GRCh38 对齐。 干净读数小于 500 万或主要读数超出 15-50 nt 范围或对齐率小于 40% 的样本被丢弃。 最后,从 57 项研究中获得了 2030 个 smRNA-seq EV 数据集(1506 个 sEV 和 524 个 IEV 数据集)。
为了更好地进行荟萃分析,所有数据集都经过精心整理,分为24种人体组织、8种来源(血浆、血清、唾液、尿液、精子、母乳、原代细胞和细胞系)和40多种疾病。
3、ncRNA的读取映射和表达估计
在读取映射之前,从不同的权威数据库获得了7种ncRNAs的参考序列。然后,使用Bowtie软件和Reads Dynamic Assignment Algorithm(RDAA)进行读取映射。RDAA步骤如下:
① 每个样本的干净读数同时映射(允许一个错配)到七个 ncRNA 参考,并将所有 ncRNA 映射的读数收集在一起以准备分配;
② 仅映射到一种 ncRNA 类型的 0 或 1 个错配读数用于计算 ncRNA 丰度;
③ 映射到一种 ncRNA 类型的 0 错配读数被视为置信读数,用于计算 EV 中的 ncRNA 比例,这将被视为参考 ncRNA 丰度供以后分配;
④ 根据参考 ncRNA 丰度优先级,将具有 0 或 1 个错配的多 ncRNA 映射读数分配给确切的一种 ncRNA 类型;
⑤ 最终的 ncRNA 丰度由指定的 ncRNA 映射读数决定。
4、特异性表达的 ncRNAs
为了检测特异表达的 ncRNA,在给定条件下,ncRNA 的表达水平用其中位数表示。用 SEGtool 分别对 sEVs 和 IEVs中高表达的 ncRNAs 进行分析。
5、ncRNA 的功能注释及其在癌症中的表达谱
ncRNAs的功能注释被整合到EVAtlas中,其中不同类型的ncRNAs有其不同的注释。 从每个ncRNA类型的相应参考数据库中提取基因定位和潜在功能等基本信息,并孵育到EVAtlas中。 例如,rRNA 的基本信息和功能是从 RNA 中心收集的。 对于 miRNA,EVAtlas 从 PubMed 收集它们的相关功能,从 FFLtool 收集 miRNA-targets 关系,从 SM2miR 收集药物相关性,从 GSCALite 收集它们在癌症中的表达谱。 对于snoRNA和tRNA,从SNORic和TRic收集它们的表达谱,并从snoDB和GtRNAdb收集它们的潜在靶基因。
EVAtlas数据库使用说明
为了让大家更好的了解EVAtlas数据库,下边将任务栏的功能进行一一介绍:
1、Home
在Home界面的检索框中输入要检索的目标ncRNA,例如“hsa-miR-21-5p”,即可获得关于hsa-miR-21-5p的相关的信息。
2、Samples
在Samples界面下,显示的是在24种情况和8种来源下数据集的分类汇总。点击进入“如Adipose()”即可获得在某一特定条件下的数据集sEV 和 IEV 情况()。
3、RNA Expression
在RNA Expression界面下,可以通过在检索框直接输入目标ncRNA进行检索。也可以通过数据库分类对目标ncRNA进行查找。
4、Specific Expression
在Specific Expression界面,用户可以 获得24 种条件下 EV 中特异性表达的 ncRNA,点击某一特定条件即可获得相应条件下特异性表达的ncRNA。
5、Document/Contact和EVmiRNA(old version)
① 通过Document界面可以了解EVAtlas数据库的详细信息,包括数据的收集与整理、EV的分离技术等等。用户还可以在Document 页面查看数据概况及下载数据,
② 通过Contact界面可以获得EVAtlas数据库开发者的联系方式。
③ 通过EVmiRNA(old version)可以链接到以前的旧版本。
6、目标ncRNA界面解读
为了让大家更好的了解EVAtlas数据库数据库,小编在最后对“目标ncRNA”界面的内容进行详细的标注解读(0)。以“hsa-miR-21-5p”为例:
参考资料:[1]http://bioinfo.life.hust.edu.cn/EVAtlas/#/
[2]EVAtlas: a comprehensive database for ncRNA expression in human extracellular vesicles