尽管很多物种都公开了物种基因结构注释信息,但仍然存在不少有问题的基因结构注释,更或者有一些基因结构没注释出来,需要补充。那么简单的办法,即直接基于转录本序列或CDS和基因组序列文件,直接重构 GFF3 文件。
    image.png
    界面如下:

    1. 功能介绍,主要到这个功能主要用于少量序列的GFF3文件重构,对于大量转录本,速度会比较慢
    2. 设置输入的 mRNA 或 CDS 序列,当然基因序列也可以,只是不会注释到基因结构
    3. 设置基因组或者基因序列信息,当然,推荐使用基因组,这样拿到真实基因组坐标
    4. 设置输出的 GFF3 文件放置路径
    5. 设置输出的 无法很好预测到基因结构的基因信息列表
    6. 其他参数:
    • Search Range:设置最大内含子长度(用于迭代找回mini-exon的具体位置)
    • Max Pre Hit:功能基于BLAST,一般无需调整,如果速度太慢,考虑降低为 50 或者 10。增加这个参数的主要原因是,BLAST输出的靠前的hit不一定是最优的hit,甚至第一个也不一定是最好的。