VDJ

参考:https://www.jianshu.com/p/a87f2601831e
VDJ基因是编码生成BCR和TCR的基因。BCR和TCR,是B(T) Cell Receptor的缩写,是一种长在B或T细胞表面的免疫球蛋白,其作用是识别抗原,接收抗原刺激。其中,BCR由重链和轻链组成,TCR由α和β链组成。
每一个BCR,包含两条重链和两条轻链。其中重链由一个可变区(V区)和三个恒定区(C区)组成,轻链则包含一个可变区与一个恒定区。重链的恒定区,决定了BCR的免疫原性,即决定了它属于5类免疫球蛋白(IgA、IgG、IgM、IgD、IgE)中的哪一种。而轻链的恒定区,则决定了搭配的轻链种类(k或入型)。而可变区(V区)则决定了它的特异性,即决定了它能和什么样的抗原结合。
image.png
image.png

cellranger

使用cellranger进行定量

  1. cellranger vdj
  2. cellranger count
  1. cellranger vdj --id=自己给样本的命名\
  2. --reference==/pathway/ref 参考基因组所在的路径\
  3. --fastqs=/pathway/fastqs 对应fastq所在位置\
  4. --sample=sample fastq前面的编号,方便识别
  5. --localcores=20 设置计算的核心数
  6. --localmen=100 设置计算的内存
  7. --denovo 不添加denovo参数的时候,序列会以局部比对的方式,比对到10X官网上下载的参考序列上(就是reference),反之,则是先对reads进行组装,然后再比对。
  8. --inner-enrichment-primers 是对扩增引物的指定。适用于除了人和鼠之外,对其他物种进行V(D)J测序时,可能需要自行设定引物序列。

结果:

  1. Outputs:
  2. - Run summary HTML: /outs/web_summary.html
  3. - Run summary CSV: /outs/metrics_summary.csv
  4. - Clonotype info: /outs/clonotypes.csv (需要)
  5. - Filtered contig sequences FASTA: /outs/filtered_contig.fasta
  6. - Filtered contig sequences FASTQ: /outs/filtered_contig.fastq
  7. - Filtered contigs (CSV): /outs/filtered_contig_annotations.csv(需要)
  8. - All-contig FASTA: /outs/all_contig.fasta
  9. - All-contig FASTA index: /outs/all_contig.fasta.fai
  10. - All-contig FASTQ: /outs/all_contig.fastq
  11. - Read-contig alignments: /outs/all_contig.bam
  12. - Read-contig alignment index: /outs/all_contig.bam.bai
  13. - All contig annotations (JSON): /outs/all_contig_annotations.json
  14. - All contig annotations (BED): /outs/all_contig_annotations.bed
  15. - All contig annotations (CSV): /outs/all_contig_annotations.csv
  16. - Barcodes that are declared to be targetted cells: /outs/cell_barcodes.json
  17. - Clonotype consensus FASTA: /outs/consensus.fasta
  18. - Clonotype consensus FASTA index: /outs/consensus.fasta.fai
  19. - Clonotype consensus FASTQ: /outs/consensus.fastq
  20. - Contig-consensus alignments: /outs/consensus.bam
  21. - Contig-consensus alignment index: /outs/consensus.bam.bai
  22. - Clonotype consensus annotations (JSON): /outs/consensus_annotations.json
  23. - Clonotype consensus annotations (CSV): /outs/consensus_annotations.csv(需要)
  24. - Concatenated reference sequences: /outs/concat_ref.fasta
  25. - Concatenated reference index: /outs/concat_ref.fasta.fai
  26. - Contig-reference alignments: /outs/concat_ref.bam
  27. - Contig-reference alignment index: /outs/concat_ref.bam.bai
  28. - Loupe V(D)J Browser file: /outs/vloupe.vloupe

免疫组库 - 图3

clonotypes.csv

免疫组库 - 图4
clonotype_id:是这个样本内部依次排下去的序号,不同样本之间不通用!!!
frequency:这个表示这个克隆型在样本中的多少个cell中被检测到,侧面部分反映了这个BCR的丰度
proportion:clonotype表达的细胞数占样本细胞总数的比例
CDR3区域的氨基酸构成。
CDR3区域的核苷酸组合。

CDR3是V(D)J基因编码的核心区域,通常会包含V基因的一部分,然后D基因,还有J基因的一部分,因此是BCR或者TCR上最具有代表性的,最具有辨识度的一段区域

不同的annotation.csv文件。侧重不同层面对数据进行注释和解读。

Contig 注释结果文件
image.png
官方说明:https://support.10xgenomics.com/single-cell-vdj/software/pipelines/latest/output/overview

单细胞数据分析

数据读取
数据质控
数据标准化
数据筛选
数据归一化
主成分选择
细胞聚类
细胞降维
marker基因分析及可视化
细胞群的差异基因

TCR/BCR分析

数据读取
数据质控
数据清洗
克隆型统计
不同V(D)J基因统计
不同链CDR3统计

常规分析:

1.CDR3长度统计

  1. immunarch::repExplore(immdata$data,"lens",.col = "nt") %>% vis()
  2. scRepertoire::lengthContig(combined, cloneCall="nt", chains = "combined")

image.png
“nt” for nucleotide sequences,
“aa” for amino acid sequences,
“v” for V gene segments,
“j” for J gene segments.

CDR3 gene (gene)
CDR3 nucleotide (nt)
CDR3 amino acid (aa)
CDR3 gene+nucleotide (gene+nt)