NCBI原始数据极速下载

admin 5 2025-02-13 14:31:08 编辑

今天教一下大家如何更加快速的(可都是Mb/s的速度奥)下载NCBI数据,包括转录组、基因组原始数据SRA文件和基因组组装及注释数据(genome和GFF文件),还有其他NCBI上所有数据大家自己发挥,都能找到,快速下载!

一、window系统

1、软件下载。Aspera Connect下载, 下载地址:http://www.asperasoft.com/downloads,选择相应版本,安装到本地电脑上;

2、数据网址获得。所有适用于aspera下载的数据均在此网址内http://www.ncbi.nlm.nih.gov/projects/faspftp/,你只需要找到对应的数据点击即可弹出aspera软件下载界面,下载即可(一个一个下,不可贪多奥!)

SRA数据下载截图,找到对应的SRR号,点击黄色部分SRR000001.sra即可完成下载

基因组相关信息网址:找到genome,然后找到对应物种拉丁文即可,注意点击黄色部分向右的小箭头,会翻页的奥!(别找不到自己的物种)

二、linux系统

1. 进入linux服务器,下载aspera。

输入:wgethttp://downloads.asperasoft.com/download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz

将会开始下载。

2. 下载完毕后,解压,输入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz

3. 安装输入:sh aspera-connect-3.1.1.70545-linux-64.sh

4. cd 到/home/usrname文件夹,ls-a就能看到 .aspera

这就是安装的文件夹。

5. 重要一步,添加环境变量,否则不能用。输入  

exportPATH=$PATH:/home/username/.aspera/connect/bin

6. 数据下载。

可以按照这个模板去下载了SRA数据(如果很多可以把所有命令写到一个shell里面,nohup提交睡大觉去就可以了,明早一醒,全部ok)

nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ &    

可以按照此模板下载基因组相关数据

~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./

其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根据你要下载的基因组改成NCBI FTP上的基因组、GFF和CDS文件名字

其他类型数据类似

欢迎关注

 

NCBI原始数据极速下载

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 李笑来老师说:付费就是捡便宜
相关文章