介绍
NCBI
非冗余
NR 数据库包括废铜与的 GenBank CDS 翻译序列 + RefSeq + PDB + Swiss-Prot + PIR + PRF,同时包括PAT、TSA 和 env_nr 等来源序列。
下载
ascp -T -l 80M -k 1 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp.ncbi.nih.gov --user=anonftp --mode=recv /blast/db/FASTA/nr.gz ./
## 下载## 使用blast软件自带程序下载nt数据库update_blastdb.pl --decompress --num_threads 10 nt## 如下载失败,也可使用curl或者wget下载后解压缩## ncbi数据下载地址:https://ftp.ncbi.nlm.nih.gov/# curl -f -L -O -C - https://ftp.ncbi.nlm.nih.gov/blast/db/nt.[0-9][0-7].tar.gz# tar -zxvf nt.*.tar.gz## 下载ncbi taxonomy数据库, taxonkit使用wget https://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gzmkdir ~/.taxonkittar -zxvf taxdump.tar.gz -C ~/.taxonkit
