Hifiasm 用于 PacBio HiFi reads 快速单倍型从头组装,能够在几小时内组装人类基因组、几天内组装约 30Gb 的加州红木基因组。Hifiasm 可以竞争成为能够生成最高质量 partially phased 组装的软件。提供父母本的短 reads 或 Hi-C 数据,理论上可以实现迄今最好的单倍型组装。

1. 介绍

工具 | 3 | 2021 | Hifiasm - 图1

2. 安装

  1. conda install hifiasm
  1. hifiasm --version
  2. ## 0.19.3-r572

3. 参数

3.1 概要

  • 仅用HiFi reads进行组装:
  1. hifiasm -o [prefix] -t [nThreads] [options] input1.fq [input2.fq [...]]
  • Trio binning assembly with yak dumps:
  1. yak count -o paternal.yak -b37 [-t nThreads] [-k kmerLen] paternal.fq.gz
  2. yak count -o maternal.yak -b37 [-t nThreads] [-k kmerLen] maternal.fq.gz
  3. hifiasm [-o prefix] [-t nThreads] [options] -1 paternal.yak -2 maternal.yak child.hifi.fq.gz
  • HiFi + Hi-C组装:
  1. hifiasm -o [prefix] -t [nThreads] --h1 [hic_r1.fq.gz,...] --h2 [hic_r2.fq.gz,...] [options] HiFi.read.fq.gz

https://github.com/lh3/yak

3.2 通用选项

  • -o : 输出文件的前缀
  • -t : 线程数
  • -h: 帮助信息
  • --version: 输出版本号

3.3 错误纠正选项

  • -k :
  • -w :
  • -f :
  • -D :
  • -N :
  • -r :
  • -z :
  • --max-kocc :
  • --hg-size :
  • --min-hist-cn

3.4 组装选项

3.5 Trio-binning选项

3.6 清楚重复选项

  • -l
  • -s
  • -O

3.7 Hi-C整合选项

  • --h1 :
  • --h2 :
  • --n-weight :
  • --n-perturb :
  • --f-perturb :
  • --seed :
  • --l-msjoin :

4. 运行

5. 结果

参考

github 地址:https://github.com/chhylp123/hifiasm

文章:Haplotype-resolved de novo assembly using phased assembly graphs with hifiasm

文章:Haplotype-resolved assembly of diploid genomes without parental data

更多:https://hifiasm.readthedocs.io/en/latest/index.html

报告:https://www.youtube.com/watch?v=Gt7_mwpIlXw 55分钟开始为李恒报告

xuzhougeng | hifiasm对HiFi PacBio进行组装

公众号 | 生信菜鸟团 | 一文带你了解PacBio HiFi Reads与其基因组组装