介绍

NCBI

非冗余

NR 数据库包括废铜与的 GenBank CDS 翻译序列 + RefSeq + PDB + Swiss-Prot + PIR + PRF,同时包括PAT、TSA 和 env_nr 等来源序列。

下载

  1. ascp -T -l 80M -k 1 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp.ncbi.nih.gov --user=anonftp --mode=recv /blast/db/FASTA/nr.gz ./
  1. ## 下载
  2. ## 使用blast软件自带程序下载nt数据库
  3. update_blastdb.pl --decompress --num_threads 10 nt
  4. ## 如下载失败,也可使用curl或者wget下载后解压缩
  5. ## ncbi数据下载地址:https://ftp.ncbi.nlm.nih.gov/
  6. # curl -f -L -O -C - https://ftp.ncbi.nlm.nih.gov/blast/db/nt.[0-9][0-7].tar.gz
  7. # tar -zxvf nt.*.tar.gz
  8. ## 下载ncbi taxonomy数据库, taxonkit使用
  9. wget https://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz
  10. mkdir ~/.taxonkit
  11. tar -zxvf taxdump.tar.gz -C ~/.taxonkit

参考

  1. https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/