Swiss-Prot蛋白数据下载并解压
# 使用wget命令,开启自动续传进行下载
wget -c https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
# 使用pigz进行解压
unpigz uniprot_sprot.fasta.gz
使用diamond进行blast搜索
# 使用makedb命令从fasta文件建库
diamond makedb --db diamond/swissprot --in swiss-prot/uniprot_sprot.fasta
# 使用blastx将核酸序列比对到数据库,建议输出xml文件,然后采用biopython进行解析
diamond blastx --db swissprot.dmnd --out target_gene_mRNA@swissprot.txt --query target_gene_mRNA.fas --un target_gene_mRNA_unaligned.fasta -k 1