Swiss-Prot蛋白数据下载并解压

  1. # 使用wget命令,开启自动续传进行下载
  2. wget -c https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
  3. # 使用pigz进行解压
  4. unpigz uniprot_sprot.fasta.gz

使用diamond进行blast搜索

  1. # 使用makedb命令从fasta文件建库
  2. diamond makedb --db diamond/swissprot --in swiss-prot/uniprot_sprot.fasta
  3. # 使用blastx将核酸序列比对到数据库,建议输出xml文件,然后采用biopython进行解析
  4. diamond blastx --db swissprot.dmnd --out target_gene_mRNA@swissprot.txt --query target_gene_mRNA.fas --un target_gene_mRNA_unaligned.fasta -k 1