基础知识

流程image.png

参考基因组的准备image.png

image.pngimage.png
image.png
就是准备基因组文件fasta 和 注释文件gtf gff

文件格式介绍

fastaimage.png

GFF image.pngimage.pngimage.png

GTF

image.png

Ensembl数据库

image.png

思考题

image.png

数据比对

比对流程

image.pngimage.png
image.pngimage.png
注意关注总比对率:image.png以及使用MultiQC进行可视化

比对结果文件sam/bam格式

分为头部区和主体区 这段比较长 建议联合PDF和老师视频一起看

subjunc比对

索引的构建

image.png

代码

代码部分还是和上一篇一样 修改地址很重要
值得注意的是,考虑到索引的构架很费时间,上课使用的是链接。但是如果是自己构建的话,需要好好考虑下载及参考基因组版本的问题
all.id.summary.bam 查看定量情况,关注assigned这一行,越高越好

hista代码注意地址和ID的修改!!-1,-2文件的名字

本文文章pdf内容和代码均来自于生信技能树课程