Hifiasm 用于 PacBio HiFi reads 快速单倍型从头组装,能够在几小时内组装人类基因组、几天内组装约 30Gb 的加州红木基因组。Hifiasm 可以竞争成为能够生成最高质量 partially phased 组装的软件。提供父母本的短 reads 或 Hi-C 数据,理论上可以实现迄今最好的单倍型组装。
1. 介绍
2. 安装
conda install hifiasm
hifiasm --version
## 0.19.3-r572
3. 参数
3.1 概要
- 仅用HiFi reads进行组装:
hifiasm -o [prefix] -t [nThreads] [options] input1.fq [input2.fq [...]]
- Trio binning assembly with yak dumps:
yak count -o paternal.yak -b37 [-t nThreads] [-k kmerLen] paternal.fq.gz
yak count -o maternal.yak -b37 [-t nThreads] [-k kmerLen] maternal.fq.gz
hifiasm [-o prefix] [-t nThreads] [options] -1 paternal.yak -2 maternal.yak child.hifi.fq.gz
- HiFi + Hi-C组装:
hifiasm -o [prefix] -t [nThreads] --h1 [hic_r1.fq.gz,...] --h2 [hic_r2.fq.gz,...] [options] HiFi.read.fq.gz
3.2 通用选项
-o
: 输出文件的前缀 -t
: 线程数 -h
: 帮助信息--version
: 输出版本号
3.3 错误纠正选项
-k
: -w
: -f
: -D
: -N
: -r
: -z
: --max-kocc
: --hg-size
: --min-hist-cn
3.4 组装选项
3.5 Trio-binning选项
3.6 清楚重复选项
- -l
- -s
- -O
3.7 Hi-C整合选项
--h1
: --h2
: --n-weight
: --n-perturb
: --f-perturb
: --seed
: --l-msjoin
:
4. 运行
5. 结果
参考
github 地址:https://github.com/chhylp123/hifiasm
文章:Haplotype-resolved de novo assembly using phased assembly graphs with hifiasm
文章:Haplotype-resolved assembly of diploid genomes without parental data
更多:https://hifiasm.readthedocs.io/en/latest/index.html
报告:https://www.youtube.com/watch?v=Gt7_mwpIlXw 55分钟开始为李恒报告
xuzhougeng | hifiasm对HiFi PacBio进行组装
公众号 | 生信菜鸟团 | 一文带你了解PacBio HiFi Reads与其基因组组装