介绍

GenomeScope 分为两个版本,分别为:

  • GenomeScope 只能预测二倍体基因组。

http://genomescope.org/

https://github.com/schatzlab/genomescope

  • GenomeScope 2.0 可以预测多倍体物种。

http://genomescope.org/genomescope2.0/

https://github.com/tbenavi1/genomescope2.0

我们主要介绍更新的 2.0 版本。

GenomeScope 2.0 能够利用 KMC(https://github.com/refresh-bio/KMC)或 Jellyfish(https://github.com/gmarcais/Jellyfish)软件计算出的 K-mer 频数统计分布信息,能对基因组进行评估(对多倍体物种也能评估,GenomeScope 不行)。

运行

基于Jellyfish的结果,使用GenomeScope 2.0可以画出k-mer图并评估基因组大小、杂合率和重复序列含量。

jellyfish 统计 K-mer 频率

  1. jellyfish count \
  2. *.fastq \
  3. -m 21 \
  4. -s 1G \
  5. -C \
  6. -t 10 \
  7. -o reads.jf
  8. jellyfish histo -t 10 reads.jf > reads.histo

参考

  1. http://genomescope.org/

github 地址:https://github.com/schatzlab/genomescope

github 地址:https://github.com/tbenavi1/genomescope2.0

文章:GenomeScope: fast reference-free genome profiling from short reads

文章:GenomeScope 2.0 and Smudgeplot for reference-free profiling of polyploid genomes

公众号 | 生信修炼手册 | GenomeScope评估基因组大小和杂合度

  1. 使用Jellyfish和GenomeScope评估基因组大小和杂合度