基础知识
流程
数据标准化
FPKM
RPM
TPM
各种值使用的场合
数据预处理
异常样本于重复行检测
样本表达总体分布
样本之间的相关性
差异表达分析
可以从R语言分析,也可以在Linux上进行脚本分析(在result文件夹里面的脚本)
值得注意的是,id转换,可以使用clauster包,但是更建议使用gtf文件的里面的转换。以及之前思考题有说如何提取相关的文件内容
差异结果可视化
- 热图中想要标记特定的基因labels 这里开始,或者说使用complexheatmap包
- 如果热图的聚类不符合分组cluster_cols = F,这样他就会按照文本顺序分布,所以提前把实验与对照组放在一起,= FALSE 就可以了
- 火山图中 p值越小,log后越大。
- Sperman分析钱不用将数据进行log转换——log不会改变相对大小关系
person需要进行log转换
- edgeRheDeseq2一般使用原始count值,前者这种方法找到的差异基因多,但是假阳性率会偏高;同还是还可以对无生物学重复的进行统计
- id转换建议使用gtf文件,思考题有讲如何转换