参考:生信技能树公众号、单细胞天地公众号、周运来就是我(简书)。 备注:仅作为笔记学习,无任何商业用途。

因为参数需要自己摸索和调整,所以其实拿到细胞亚群数量是因而而异的,取决于你前面降维的程度,分群的算法和参数。不过最重要的是拿到了不同细胞亚群后需要对它进行命名,给出生物学的解释。不同的人分析同一个数据集,有略微不同的结果是可以接受的,保证自己的生物学故事圆满即可。

标记基因

我给大家的单细胞进阶课程里面,示例文章《Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA》, 就是一个使用seurat标准流程对PBMC分群后如下:
image.png
得到了这13个细胞类群,而且也细致的决定它们的亚群名字。实际上PBMC的不同细胞亚群的标记基因是比较明确,的比如:在文章:Nucleic Acids Res. 2018 Apr ,dropClust: efficient clustering of ultra-large scRNA-seq data.就写的很清楚:
image.png
这些标记基因在不同亚群细胞的表达量热图或者小提琴图展示一下,就明白了为什么它们可以作为标记基因,来对细胞亚群进行命名啦。

获取标记基因

这样的标记基因列表,有一些网页工具会收集,比如一些常用标记基因数据库:Cellmarker(http://bio-bigdata.hrbmu.edu.cn/CellMarker/)HCA(https://www.humancellatlas.org/)MCA(http://bis.zju.edu.cn/MCA/atlas2.html)。

也有自己查询自己领域内的全部文献, 然后整理出来标记基因列表。查询文献这个工作量是蛮大的,所以一般来说,作者也会把他们最后总结好的细胞亚群注释使用的标记基因整理成为一个表格,如下:
image.png

常用的标记基因

来源:包括后续细胞亚型基因,来自于生信技能树曾健明老师和笔者补充。

  1. genes_to_check = c('PTPRC', # immune cell
  2. 'CD3D', 'CD3E', 'CD4','CD8A', # T Cells
  3. 'CD19', 'CD79A', 'MS4A1', # B cells
  4. 'IGHG1', 'MZB1', 'SDC1', # Plasma cells
  5. 'CD68', 'CD163', 'CD14', 'C1QA', 'C1QB', 'ITGAM', # macrophages
  6. 'TPSAB1', 'TPSB2', # mast cells,
  7. 'RGS5', 'CD73', 'CD105', 'CD44', # perivascular cell
  8. 'CD14', 'S100A9', 'S100A8', 'MMP19', # monocyte
  9. 'FCGR3A', 'FGFBP2', 'CX3CR1', 'KLRB1', 'NCR1', # NK cells
  10. 'LAMP3', 'IDO1','IDO2',## DC3
  11. 'CD1E','CD1C', # DC2
  12. 'FGF7','MME', 'ACTA2', ## human Fibroblasts
  13. 'DCN', 'LUM', 'GSN' , ## mouse PDAC Fibroblasts
  14. 'MKI67' , 'TOP2A',
  15. 'PECAM1', 'VWF', ## Endothelial cells
  16. 'EPCAM' , 'KRT19', 'KRT7', 'PROM1', 'ALDH1A1', 'CD24', # epithelial or tumor
  17. 'FYXD2', 'TM4SF4', 'ANXA4',# cholangiocytes
  18. 'APOC3', 'FABP1', 'APOA1', # hepatocytes
  19. )

image.png

Crisan M, Corselli M, Chen WC, Péault B. Perivascular cells for regenerative medicine. J Cell Mol Med. 2012 Dec;16(12):2851-60. doi: 10.1111/j.1582-4934.2012.01617.x. PMID: 22882758; PMCID: PMC4393715.

免疫细胞分支

参考:CST官方网站。https://blog.cellsignal.cn/immunology-what-cells-have-a-myeloid-lineage-and-how-are-they-identified

image.png

人体内的免疫细胞分为:髓系细胞和淋巴系细胞。
髓系细胞:单核细胞(monocyte)(后续可分化为DC细胞和巨噬细胞);中性粒细胞(neutrophil);嗜酸性粒细胞(eosinophil);嗜碱性粒细胞(Basophil);巨核细胞(megakaryocyte,后续可以产生血小板);红细胞(erythrocytes)
淋巴系细胞:T细胞;B细胞(会分化为浆细胞);NK细胞

常见免疫细胞标记基因

参考:CST官方网站。

image.png

T细胞标记基因

来源:包括后续细胞亚型基因,来自于生信技能树曾健明老师和笔者补充。

  1. # T cell genes
  2. genes_to_check = c('PTPRC', # immune cell
  3. 'CD3D', 'CD3E', 'SELL', 'TCF7', 'ITGA1', 'CCR6', # pan T
  4. 'CD4', # CD4T
  5. 'IFNG', 'CXCR3', 'TBX21', 'CRTH2', 'GATA3', 'CCR6', # Thelper
  6. 'CXCR5', 'ICOS', 'PDCD1', 'PD1', # Tfh
  7. 'FOXP3', 'IL2RA', 'CTLA4', 'IL2RA', # Treg
  8. 'CD8A', 'CCR7', 'GZMB', 'GZMK', 'CCL5', 'CCL3', 'CCL4', 'PRF1', 'KLRG1', # CD8T
  9. 'CXCR6' # memoryT
  10. )

NK细胞

  1. # NK cell genes
  2. genes_to_check = c('PTPRC', # immune cell
  3. 'FCGR3A', 'FGFBP2', 'KLRB1', 'NCR1', 'GZMB', 'GZMK',
  4. 'IFNG', 'CCR6', 'CCL3', 'PRF1', 'NKG7', 'NCAM1', 'CD244')

B细胞标记基因

  1. # B cell genes
  2. genes_to_check = c('PTPRC', # immune cell
  3. 'CD19', 'CD22', 'MS4A1', 'CD79A', 'CD83', 'FCER2', 'CR2', 'TNFRSF13C', 'BCL6', # Pan B
  4. 'TCL1A', # naive B cells
  5. 'CD38', 'TNFRSF17', 'IGHG1', 'IGHG4', 'SDC1' # plasma B cells
  6. )

髓系细胞标记基因

  1. # Myeloid cell genes
  2. genes_to_check = c('PTPRC', # immune cell
  3. 'MRC1', 'MSR1', 'ITGAM', 'SIGLEC7', # pan myeloid
  4. 'CD68', 'CD86', # M1 macrophages
  5. 'CD163', # M2 macrophages
  6. 'C1QA', 'C1QB', 'CX3CR1', # Microglia macrophages
  7. 'CD14', 'CD33', 'SIRPA', # monocyte
  8. 'S100A9', 'S100A8', # neutrophil
  9. 'XCR1', 'CLEC9A', 'FCER1A', 'ITGAE', 'ITGAX', # cDC1
  10. 'CD1E', 'CD1C', # cDC2
  11. 'LAMP3', 'IDO1', 'IDO2', 'TCF4', 'IL3RA', 'GZMB', 'IRF7', # pDC
  12. 'TPSAB1', 'TPSB2', # mast cells
  13. )

Zhang L, Li Z, Skrzypczynska KM, Fang Q, Zhang W, O’Brien SA, He Y, Wang L, Zhang Q, Kim A, Gao R, Orf J, Wang T, Sawant D, Kang J, Bhatt D, Lu D, Li CM, Rapaport AS, Perez K, Ye Y, Wang S, Hu X, Ren X, Ouyang W, Shen Z, Egen JG, Zhang Z, Yu X. Single-Cell Analyses Inform Mechanisms of Myeloid-Targeted Therapies in Colon Cancer. Cell. 2020 Apr 16;181(2):442-459.e29. doi: 10.1016/j.cell.2020.03.048. PMID: 32302573.

image.png

上皮细胞标记基因

  1. # epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
  2. # alveolar type I cell (AT1; AGER+)
  3. # alveolar type II cell (AT2; SFTPA1)
  4. # secretory club cell (Club; SCGB1A1+)
  5. # basal airway epithelial cells (Basal; KRT17+)
  6. # ciliated airway epithelial cells (Ciliated; TPPP3+)
  7. genes_to_check = c('EPCAM', 'KRT19', 'PROM1', 'ALDH1A1', 'CD24', # epi or tumor
  8. 'AGER', 'SFTPA1', 'SCGB1A1', 'KRT17', 'TPPP3',
  9. 'KRT4', 'KRT14', 'KRT8', 'KRT18',
  10. 'CD3D', 'PTPRC' )

基质细胞标记基因

  1. # stromal_marker
  2. genes_to_check = c('TEK', 'PTPRC', 'EPCAM', 'PDPN', 'PECAM1', 'PDGFRB',
  3. 'CSPG4', 'GJB2', 'RGS5', 'ITGA7',
  4. 'ACTA2', 'RBP1', 'CD36', 'ADGRE5', 'COL11A1', 'FGF7', 'MME')