基础知识

流程

image.png

数据标准化

测序深度与基因长度
image.png
image.pngimage.png

FPKM

image.png

RPM

image.png

TPM

image.png

各种值使用的场合

image.png

数据预处理

image.png

异常样本于重复行检测

表达总体分析与样本相关性
image.png

样本表达总体分布

image.pngimage.pngimage.png

样本之间的相关性

image.pngimage.pngimage.png

差异表达分析

image.png
可以从R语言分析,也可以在Linux上进行脚本分析(在result文件夹里面的脚本)
image.png
值得注意的是,id转换,可以使用clauster包,但是更建议使用gtf文件的里面的转换。以及之前思考题有说如何提取相关的文件内容

差异结果可视化

image.pngimage.png

  1. 热图中想要标记特定的基因labels 这里开始,或者说使用complexheatmap包

image.png

  1. 如果热图的聚类不符合分组cluster_cols = F,这样他就会按照文本顺序分布,所以提前把实验与对照组放在一起,= FALSE 就可以了
  2. 火山图中 p值越小,log后越大。
  3. Sperman分析钱不用将数据进行log转换——log不会改变相对大小关系

person需要进行log转换

  1. edgeRheDeseq2一般使用原始count值,前者这种方法找到的差异基因多,但是假阳性率会偏高;同还是还可以对无生物学重复的进行统计
  2. id转换建议使用gtf文件,思考题有讲如何转换