有时候,一些 Fatsa 序列 ID 较为复杂,如“>Unigene1 MYB Protein”,或从 NCBI,Uniprot,Swissprot 等公共数据库下载序列,往往会有复杂 ID。这一功能主要用于简化 Fasta 序列 ID。举个例子:“>Unigene1 MYB Protein”简化为“>Unigene1”。当然这应该能也专门针对一些数据库下载的特殊的 ID 格式。
    整体界面如下,
    image.png
    使用详细解释(注意,该功能是批量的):

    1. 设置输入序列文件或直接黏贴少量序列文本
    2. 设置输出序列文件或直接输出到文本区域框
    3. Remove from:从给定匹配模式处开始清理 ID,如“>Unigene_1.version3.3 confident”,使用模式“.version”即可将清理为“>Unigene_1”
    4. Remove .version:用于简单快速去除版本号等信息,如“>ABC183710.1”和“>CABT19912.3”,会直接去除“.1”和“.3”

    点击“Simplify My Sequence’s ID…”