1.
传统Bulk RNA-Seq忽略了组织的异质性,实际上组织中包含了不同种的细胞,这就是ScRNA-Seq的意义所在。
2.

质控过滤的原因是:如果细胞内检测的基因过多,可能是双细胞,建库的时候没有形成单细胞血液
3.

图 寻找2000个高变基因
(1)FindVariableFeatures() 特征选择,寻找高变异基因
高变异基因就是highly variable features(HVGs),就是在细胞与细胞间进行比较,选择表达量差别最大的基因,Seurat使用FindVariableFeatures函数鉴定高变异基因,这些基因在不同细胞之间的表达量差异很大(在一些细胞中高表达,在另一些细胞中低表达)。默认情况下,会返回2,000个高可变基因用于下游的分析,如PCA等。
利用FindVariableFeatures函数,会计算一个mean-variance结果,也就是给出表达量均值和方差的关系并且得到top variable features,这一步的目的是鉴定出细胞与细胞之间表达量相差很大的基因,用于后续鉴定细胞类型。
(2)FindMarkers() 寻找差异表达基因:
Seurat使用FindMarkers和FindAllMarkers函数进行差异表达基因的筛选
4.
tTSNE适合小数据(计算慢),UMAP适合大型数据
5.
多样本整合(不是合并细胞亚群)
https://www.bilibili.com/video/BV1S44y1b76Z?p=6&spm_id_from=pageDriver
方法1:merge,不能去除批次效应
6.
在单细胞中检测MT(线粒体RNA)是因为:线粒体RNA含量高的细胞可能已经死亡,因为正常的细胞应该是细胞核RNA含量高。
[
](https://blog.csdn.net/watermel__/article/details/121274775)
