鉴于之前文章中错别字太多的问题,现在希望大家看到错别字给留言提出来,
小编会赠送一份礼物。谢谢支持。
![手把手Aspera下载数据](https://www.yanyin.tech/cms/manage/file/d1b8c6db17d94a9abb05f8078d85ab16)
之前给大家推送过一期Aspera软件如何下载数据的文章。但是呢貌似现在Aspera官网有所改版,大家按照那个操作去做,估计会有些问题。
作为一个升级版吧,今天还是跟大家再次说下如何利用Aspera快速的下载基因组序列。
今天重点用一个实际的例子,如何从NCBI下载人的基因组序列来讲解aspera如何使用。
首先去Aspera官网下载windows Aspera
http://downloads.asperasoft.com/connect2//
下载之后,点点点,然后安装,安装完成之后,会看到电脑的快捷菜单有一个图标。
点击运行,会在电脑的右下角出现一个图标
点击这个图标选择首选项,可以进行相关的配置,比如说下载的上限。
这里值得注意的是,之前的软件都是英文,现在都支持中文了,可以间接的说明,这个东西好使。
下面,我们去下载下人的基因组。
知识点
在下载之前,大家需要对下载的原理有所了解。
就是目前http和ftp都是基于互联网TCP协议的。
TCP在远距离数据传输中存在一些先天的不足,文件越大、距离越远,其丢包、延时等问题对于传输速度的影响就越大。
但是呢IBM开发了一种基于fasp 的技术,不需要借助TCP协议,可以实现远距离,高速度,大文件的传输。速度可以到达ftp的100多倍。
上面话的重点在于,如果想用aspera进行下载,需要遵从fasp协议。如果文件不支持,就没有办法下载。
那啥片啥的,就想想的了。
那么NCBI支持aspera下载吗?
支持的。
如果你理解了,刚才我说的话,相信你不会这样去下载(右击,保存为)
这是一种错误的方式,这样启动的还是常规的ftp下载。
如何调用超级暴力的aspera下载呢
以NCBI为例
http://www.ncbi.nlm.nih.gov/projects/faspftp/
网址中注明了fasp的,是可以利用aspera进行下载的。
然后我们进入这个网址
找到人的基因组
点击进去,选择seq中人的第一条染色体。点击保存
跳出如下页面
选择允许,启动下载(有人问为啥有两次已经完成了,因为太快了,没来的及截图)
小编亲测,速度高达30Mbs
到此数据下载完成。
相信这次手把手的教学,能帮助大家节省不少的时间。
点击以下「关键词」,查看往期内容:
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史