EVAtlas:一个强大的细胞外囊泡ncRNA数据库

admin 35 2025-01-19 编辑

        今天给大家介绍一个功能强大的数据库,先贴上网址http://bioinfo.life.hust.edu.cn/EVAtlas。该数据库针对细胞外囊泡(EVs)中的非编码 RNA,有四个强大的功能:①浏览并比较24种条件和8种来源(血浆、血清、唾液、尿液、精子、母乳、原代细胞和细胞系)的EV中ncRNAs的分布;②根据条件相关组织中候选ncRNAs的表达情况,对其进行优先排序;③探索 24 种条件下 EV 中特异性表达的 ncRNA;④研究 ncRNA 功能、相关药物、靶基因和 EVs 分离方法。

导读

       活细胞释放的细胞外囊泡(EVs)是信号转导和细胞通讯的重要载体,尤其是远距离细胞之间的相互作用。从内体系统分泌的外泌体和从质膜脱落的微泡 (MVs)是 EVs 的两个主要来源。EVs的内容物包括来自源细胞的多种生物分子,如脂质、蛋白质、代谢物、DNA和RNA。非编码 RNA (ncRNA) 是 EVs 中经过充分研究的重要分子,可以传递到和调节靶细胞,并显示出生理和病理特异性,可作为候选生物标志物。ncRNA作为重要的调控成分在生物过程中发挥着至关重要的作用,其表达谱在正常和疾病状态下差异很大。 例如,微小RNA(miRNA)、小核仁RNA(snoRNA)和转移RNA(tRNA)的失调是肿瘤发生中的常见事件。

      在EVAtlas综合数据库中,研究者对2030 个 EVs smRNA-seq 数据集(1506 sEV和524 lEV数据集)的7种ncRNA(miRNA、snRNA、piRNA、snRNA、rRNA、tRNA和Y RNA)在24种条件和40多种疾病中的表达进行了整理和分析,并为在不同EV类型中的ncRNA提供了功能注释和特异性表达分析。目前,EVAtlas是EV ncRNA表达最全面的资源,已成为该领域研究的关键资源。

EVAtlas数据收集和处理

1、数据收集

      研究者使用关键字“((extracellular vesicle OR exosome OR microvesicle OR EV)AND(smRNA-seq OR miRNA-seq OR small RNA-seq))AND”从NCBI GEO和SRA数据库检索人类EV相关smRNA-seq数据集。然后,手动审查研究设计或相关论文,根据确切的 EV 大小或类型描述用 sEV 或 IEV 标记每个数据集。用于区分特定样本(sEV或IEV)归属的标准如下:

① 具有明确归属定义的样本服从于原始样本;;

② 详细描述分离方法的样品符合国际细胞外囊泡学会(ISEV)的标准;

③ 商业试剂盒提取的样品按照制造商的介绍进行分类

④ 根据“exosomes”或“microvesicles”的词频计数,将上述类别中的样本定义为sEVs或leVs;不能分组的样品被丢弃。

2、数据预处理

        FastQC(v0.11.5)用于原始数据的质量控制(QC),trimmomatic(v0.36)用于适配器移除和低质量数据修整,以获得用于进一步分析的高质量清洁读数。 Bowtie(v1.2.1)用于将干净读数与人类参考基因组 GRCh38 对齐。 干净读数小于 500 万或主要读数超出 15-50 nt 范围或对齐率小于 40% 的样本被丢弃。 最后,从 57 项研究中获得了 2030 个 smRNA-seq EV 数据集(1506 个 sEV 和 524 个 IEV 数据集)。

      为了更好地进行荟萃分析,所有数据集都经过精心整理,分为24种人体组织、8种来源(血浆、血清、唾液、尿液、精子、母乳、原代细胞和细胞系)和40多种疾病。

3、ncRNA的读取映射和表达估计

      在读取映射之前,从不同的权威数据库获得了7种ncRNAs的参考序列。然后,使用Bowtie软件和Reads Dynamic Assignment Algorithm(RDAA)进行读取映射。RDAA步骤如下:

① 每个样本的干净读数同时映射(允许一个错配)到七个 ncRNA 参考,并将所有 ncRNA 映射的读数收集在一起以准备分配;

② 仅映射到一种 ncRNA 类型的 0 或 1 个错配读数用于计算 ncRNA 丰度;

③ 映射到一种 ncRNA 类型的 0 错配读数被视为置信读数,用于计算 EV 中的 ncRNA 比例,这将被视为参考 ncRNA 丰度供以后分配;

④ 根据参考 ncRNA 丰度优先级,将具有 0 或 1 个错配的多 ncRNA 映射读数分配给确切的一种 ncRNA 类型;

⑤ 最终的 ncRNA 丰度由指定的 ncRNA 映射读数决定。

4、特异性表达的 ncRNAs

        为了检测特异表达的 ncRNA,在给定条件下,ncRNA 的表达水平用其中位数表示。用 SEGtool 分别对 sEVs 和 IEVs中高表达的 ncRNAs 进行分析。

5、ncRNA 的功能注释及其在癌症中的表达谱

        ncRNAs的功能注释被整合到EVAtlas中,其中不同类型的ncRNAs有其不同的注释。 从每个ncRNA类型的相应参考数据库中提取基因定位和潜在功能等基本信息,并孵育到EVAtlas中。 例如,rRNA 的基本信息和功能是从 RNA 中心收集的。 对于 miRNA,EVAtlas 从 PubMed 收集它们的相关功能,从 FFLtool 收集 miRNA-targets 关系,从 SM2miR 收集药物相关性,从 GSCALite 收集它们在癌症中的表达谱。 对于snoRNA和tRNA,从SNORic和TRic收集它们的表达谱,并从snoDB和GtRNAdb收集它们的潜在靶基因。

EVAtlas数据库使用说明

        为了让大家更好的了解EVAtlas数据库,下边将任务栏的功能进行一一介绍:

1、Home

       在Home界面的检索框中输入要检索的目标ncRNA,例如“hsa-miR-21-5p”,即可获得关于hsa-miR-21-5p的相关的信息。

2、Samples

       在Samples界面下,显示的是在24种情况和8种来源下数据集的分类汇总。点击进入“如Adipose()”即可获得在某一特定条件下的数据集sEV 和 IEV 情况()。

3、RNA Expression

        在RNA Expression界面下,可以通过在检索框直接输入目标ncRNA进行检索。也可以通过数据库分类对目标ncRNA进行查找。

4、Specific Expression

        在Specific Expression界面,用户可以 获得24 种条件下 EV 中特异性表达的 ncRNA,点击某一特定条件即可获得相应条件下特异性表达的ncRNA。

5、Document/Contact和EVmiRNA(old version)

① 通过Document界面可以了解EVAtlas数据库的详细信息,包括数据的收集与整理、EV的分离技术等等。用户还可以在Document 页面查看数据概况及下载数据,

② 通过Contact界面可以获得EVAtlas数据库开发者的联系方式。

③ 通过EVmiRNA(old version)可以链接到以前的旧版本。

6、目标ncRNA界面解读

       为了让大家更好的了解EVAtlas数据库数据库,小编在最后对“目标ncRNA”界面的内容进行详细的标注解读(0)。以“hsa-miR-21-5p”为例:

参考资料:[1]http://bioinfo.life.hust.edu.cn/EVAtlas/#/

[2]EVAtlas: a comprehensive database for ncRNA expression in human extracellular vesicles

EVAtlas:一个强大的细胞外囊泡ncRNA数据库

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 好看的网络图,配色困难的看过来
相关文章