基于输入的 Fasta 序列文件 ID,提取代表性序列集合,整体功能说明可以看功能界面。
    image.png
    界面详解如下:

    1. 功能说明
    2. 序列 ID 归组模式
    3. 设置输入的 Fasta 序列文件
    4. 设置输出文件路径

    这个功能目前只建议在无法获得物种的 GFF3、GTF 文件和基因组序列信息的情况下使用。
    如输入的序列文件

    ATG128734.1 … ATGGACTAGCACGTGTGT ATG128734.2 … TGGACTAGCACGTGTGTGTGCATGCA …

    可以判断 .1 或 .2 等标记了同一个基因的不同转录本,可以使用归组模式「(\w+?)\」
    对于其他类型,如

    Trans10111 gene=Gene_1 ACGATCGACTAGCATGCATCGAT Trans10112 gene=Gene_1 ACGATCGACTAGCAT …

    则需要使用新的模式,如「gene=(\w+)」来正确归组