参考:生信技能树公众号、单细胞天地公众号、周运来就是我(简书)。 备注:仅作为笔记学习,无任何商业用途。
因为参数需要自己摸索和调整,所以其实拿到细胞亚群数量是因而而异的,取决于你前面降维的程度,分群的算法和参数。不过最重要的是拿到了不同细胞亚群后需要对它进行命名,给出生物学的解释。不同的人分析同一个数据集,有略微不同的结果是可以接受的,保证自己的生物学故事圆满即可。
标记基因
我给大家的单细胞进阶课程里面,示例文章《Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA》, 就是一个使用seurat标准流程对PBMC分群后如下:
得到了这13个细胞类群,而且也细致的决定它们的亚群名字。实际上PBMC的不同细胞亚群的标记基因是比较明确,的比如:在文章:Nucleic Acids Res. 2018 Apr ,dropClust: efficient clustering of ultra-large scRNA-seq data.就写的很清楚:
这些标记基因在不同亚群细胞的表达量热图或者小提琴图展示一下,就明白了为什么它们可以作为标记基因,来对细胞亚群进行命名啦。
获取标记基因
这样的标记基因列表,有一些网页工具会收集,比如一些常用标记基因数据库:Cellmarker(http://bio-bigdata.hrbmu.edu.cn/CellMarker/)HCA(https://www.humancellatlas.org/)MCA(http://bis.zju.edu.cn/MCA/atlas2.html)。
也有自己查询自己领域内的全部文献, 然后整理出来标记基因列表。查询文献这个工作量是蛮大的,所以一般来说,作者也会把他们最后总结好的细胞亚群注释使用的标记基因整理成为一个表格,如下:
常用的标记基因
来源:包括后续细胞亚型基因,来自于生信技能树曾健明老师和笔者补充。
genes_to_check = c('PTPRC', # immune cell
'CD3D', 'CD3E', 'CD4','CD8A', # T Cells
'CD19', 'CD79A', 'MS4A1', # B cells
'IGHG1', 'MZB1', 'SDC1', # Plasma cells
'CD68', 'CD163', 'CD14', 'C1QA', 'C1QB', 'ITGAM', # macrophages
'TPSAB1', 'TPSB2', # mast cells,
'RGS5', 'CD73', 'CD105', 'CD44', # perivascular cell
'CD14', 'S100A9', 'S100A8', 'MMP19', # monocyte
'FCGR3A', 'FGFBP2', 'CX3CR1', 'KLRB1', 'NCR1', # NK cells
'LAMP3', 'IDO1','IDO2',## DC3
'CD1E','CD1C', # DC2
'FGF7','MME', 'ACTA2', ## human Fibroblasts
'DCN', 'LUM', 'GSN' , ## mouse PDAC Fibroblasts
'MKI67' , 'TOP2A',
'PECAM1', 'VWF', ## Endothelial cells
'EPCAM' , 'KRT19', 'KRT7', 'PROM1', 'ALDH1A1', 'CD24', # epithelial or tumor
'FYXD2', 'TM4SF4', 'ANXA4',# cholangiocytes
'APOC3', 'FABP1', 'APOA1', # hepatocytes
)
Crisan M, Corselli M, Chen WC, Péault B. Perivascular cells for regenerative medicine. J Cell Mol Med. 2012 Dec;16(12):2851-60. doi: 10.1111/j.1582-4934.2012.01617.x. PMID: 22882758; PMCID: PMC4393715.
免疫细胞分支
参考:CST官方网站。https://blog.cellsignal.cn/immunology-what-cells-have-a-myeloid-lineage-and-how-are-they-identified
人体内的免疫细胞分为:髓系细胞和淋巴系细胞。
髓系细胞:单核细胞(monocyte)(后续可分化为DC细胞和巨噬细胞);中性粒细胞(neutrophil);嗜酸性粒细胞(eosinophil);嗜碱性粒细胞(Basophil);巨核细胞(megakaryocyte,后续可以产生血小板);红细胞(erythrocytes)
淋巴系细胞:T细胞;B细胞(会分化为浆细胞);NK细胞
常见免疫细胞标记基因
参考:CST官方网站。
T细胞标记基因
来源:包括后续细胞亚型基因,来自于生信技能树曾健明老师和笔者补充。
# T cell genes
genes_to_check = c('PTPRC', # immune cell
'CD3D', 'CD3E', 'SELL', 'TCF7', 'ITGA1', 'CCR6', # pan T
'CD4', # CD4T
'IFNG', 'CXCR3', 'TBX21', 'CRTH2', 'GATA3', 'CCR6', # Thelper
'CXCR5', 'ICOS', 'PDCD1', 'PD1', # Tfh
'FOXP3', 'IL2RA', 'CTLA4', 'IL2RA', # Treg
'CD8A', 'CCR7', 'GZMB', 'GZMK', 'CCL5', 'CCL3', 'CCL4', 'PRF1', 'KLRG1', # CD8T
'CXCR6' # memoryT
)
NK细胞
# NK cell genes
genes_to_check = c('PTPRC', # immune cell
'FCGR3A', 'FGFBP2', 'KLRB1', 'NCR1', 'GZMB', 'GZMK',
'IFNG', 'CCR6', 'CCL3', 'PRF1', 'NKG7', 'NCAM1', 'CD244')
B细胞标记基因
# B cell genes
genes_to_check = c('PTPRC', # immune cell
'CD19', 'CD22', 'MS4A1', 'CD79A', 'CD83', 'FCER2', 'CR2', 'TNFRSF13C', 'BCL6', # Pan B
'TCL1A', # naive B cells
'CD38', 'TNFRSF17', 'IGHG1', 'IGHG4', 'SDC1' # plasma B cells
)
髓系细胞标记基因
# Myeloid cell genes
genes_to_check = c('PTPRC', # immune cell
'MRC1', 'MSR1', 'ITGAM', 'SIGLEC7', # pan myeloid
'CD68', 'CD86', # M1 macrophages
'CD163', # M2 macrophages
'C1QA', 'C1QB', 'CX3CR1', # Microglia macrophages
'CD14', 'CD33', 'SIRPA', # monocyte
'S100A9', 'S100A8', # neutrophil
'XCR1', 'CLEC9A', 'FCER1A', 'ITGAE', 'ITGAX', # cDC1
'CD1E', 'CD1C', # cDC2
'LAMP3', 'IDO1', 'IDO2', 'TCF4', 'IL3RA', 'GZMB', 'IRF7', # pDC
'TPSAB1', 'TPSB2', # mast cells
)
Zhang L, Li Z, Skrzypczynska KM, Fang Q, Zhang W, O’Brien SA, He Y, Wang L, Zhang Q, Kim A, Gao R, Orf J, Wang T, Sawant D, Kang J, Bhatt D, Lu D, Li CM, Rapaport AS, Perez K, Ye Y, Wang S, Hu X, Ren X, Ouyang W, Shen Z, Egen JG, Zhang Z, Yu X. Single-Cell Analyses Inform Mechanisms of Myeloid-Targeted Therapies in Colon Cancer. Cell. 2020 Apr 16;181(2):442-459.e29. doi: 10.1016/j.cell.2020.03.048. PMID: 32302573.
上皮细胞标记基因
# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
# alveolar type I cell (AT1; AGER+)
# alveolar type II cell (AT2; SFTPA1)
# secretory club cell (Club; SCGB1A1+)
# basal airway epithelial cells (Basal; KRT17+)
# ciliated airway epithelial cells (Ciliated; TPPP3+)
genes_to_check = c('EPCAM', 'KRT19', 'PROM1', 'ALDH1A1', 'CD24', # epi or tumor
'AGER', 'SFTPA1', 'SCGB1A1', 'KRT17', 'TPPP3',
'KRT4', 'KRT14', 'KRT8', 'KRT18',
'CD3D', 'PTPRC' )
基质细胞标记基因
# stromal_marker
genes_to_check = c('TEK', 'PTPRC', 'EPCAM', 'PDPN', 'PECAM1', 'PDGFRB',
'CSPG4', 'GJB2', 'RGS5', 'ITGA7',
'ACTA2', 'RBP1', 'CD36', 'ADGRE5', 'COL11A1', 'FGF7', 'MME')