fastqc结果查看
html文件则为结果展示文件,zip文件储存了结果以及图片,下载查看
2-1 fastqc结果(可以通过shell脚本批量比对,也可以把文件都跟在后面)
序列的基本信息
(2)每一个碱基的质量分布情况,一般分布在绿色区域(大于Q30)较好黄色(大于Q20),红色区域质量较差
(3)每一条序列的质量情况,纵轴为reads数,横轴为质量,大多分布在Q30以上
(4)每条序列的GC含量、AT含量,好的结果为A=T以及G=C(如下图)
(4)每条序列的GC含量百分比,蓝色为经验值,红色为样品,符合经验值的分布(如下图)
(5)N碱基的数量
(6)序列长度的分布
(6)重复序列的占比
(6)是否有大量重复的序列
(7)测序接头情况,存在接头(下下图为不存在接头)