介绍
GenomeScope 分为两个版本,分别为:
- GenomeScope 只能预测二倍体基因组。
https://github.com/schatzlab/genomescope
- GenomeScope 2.0 可以预测多倍体物种。
http://genomescope.org/genomescope2.0/
https://github.com/tbenavi1/genomescope2.0
我们主要介绍更新的 2.0 版本。
GenomeScope 2.0 能够利用 KMC(https://github.com/refresh-bio/KMC)或 Jellyfish(https://github.com/gmarcais/Jellyfish)软件计算出的 K-mer 频数统计分布信息,能对基因组进行评估(对多倍体物种也能评估,GenomeScope 不行)。
运行
基于Jellyfish的结果,使用GenomeScope 2.0可以画出k-mer图并评估基因组大小、杂合率和重复序列含量。
jellyfish 统计 K-mer 频率
jellyfish count \
*.fastq \
-m 21 \
-s 1G \
-C \
-t 10 \
-o reads.jf
jellyfish histo -t 10 reads.jf > reads.histo
参考
github 地址:https://github.com/schatzlab/genomescope
github 地址:https://github.com/tbenavi1/genomescope2.0
文章:GenomeScope: fast reference-free genome profiling from short reads
文章:GenomeScope 2.0 and Smudgeplot for reference-free profiling of polyploid genomes
公众号 | 生信修炼手册 | GenomeScope评估基因组大小和杂合度