王英珍

不积硅步,无以至千里;不积小流,无以成江河

NCBI-SRA数据上传流程

09 Mar 2017 »

NCBI 数据上传 SRA

上传地址:https://submit.ncbi.nlm.nih.gov
NCBI的SRA数据上传大致可以分为以下几个步骤:

前几步大概就是创建Bioproject,BioSample(一个Bioproject可以对应多个BioSample号)填写项目的基本信息等等;

据我的经验来讲,前边的步骤都不算难,按照网页指示一步步next就可以了。最让人头疼的主要是数据传输的过程,NCBI的官网给出了以下三种上传方法: https://submit.ncbi.nlm.nih.gov/subs/sra/ TUPIAN
1.asper软件上传
该方法是利用Aspera这个软件来进行上传的,优点是 传输稳定,易操作;缺点是必须和上传的网页关联起来,上传数据期间,ncbi上传页面不能关闭。
2.aspera命令行上传
这种方法当然也需要装一下Aspera这个软件了,也是我极力推荐大家的一种方法,该方法适合大批量数据传输,优点是:速度极快(3~4m/s),传输相对稳定,可以续传,而且最重要的是不需要和网页关联。该方法其实是预先通过命令行,将数据传输到ncbi服务器指定的目录下,在网页 提交传输靠后的位置,直接选择该文件夹就行,与上一种方法大为不同。

以下是commandline:   
ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/file(s)> subasp@upload.ncbi.nlm.nih.gov:uploads/wangyingzhen91@163.com_D4NwgQSa/<submission_folder>/  
其中<path/to/key_file> 可以在https://submit.ncbi.nlm.nih.gov/subs/sra/下载。<submission_folder>就是你需要上传ncbi的目录

3.ftp上传
该方法不需要下载asper软件,是通过ncbi给予的账户密码登录服务器,新建一个目录上传数据。个人认为这种方法比较鸡肋,ncbi的服务器很不稳定,时常连接不上,龟速传输

	Address: ftp-private.ncbi.nlm.nih.gov

	Username: subftp

	Password: w4pYB9VQ

Author: 王英珍
qq: 296085360
email:wangyz666@outlook.com