介绍
NCBI
非冗余
NR 数据库包括废铜与的 GenBank CDS 翻译序列 + RefSeq + PDB + Swiss-Prot + PIR + PRF,同时包括PAT、TSA 和 env_nr 等来源序列。
下载
ascp -T -l 80M -k 1 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp.ncbi.nih.gov --user=anonftp --mode=recv /blast/db/FASTA/nr.gz ./
## 下载
## 使用blast软件自带程序下载nt数据库
update_blastdb.pl --decompress --num_threads 10 nt
## 如下载失败,也可使用curl或者wget下载后解压缩
## ncbi数据下载地址:https://ftp.ncbi.nlm.nih.gov/
# curl -f -L -O -C - https://ftp.ncbi.nlm.nih.gov/blast/db/nt.[0-9][0-7].tar.gz
# tar -zxvf nt.*.tar.gz
## 下载ncbi taxonomy数据库, taxonkit使用
wget https://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz
mkdir ~/.taxonkit
tar -zxvf taxdump.tar.gz -C ~/.taxonkit