chipseq-0-课程序言
- 00:01:10 - chipseq该怎么学?
- 00:03:12 - 文献《Polycomb Associates Genome-wide with a Specific RNA Polymerase Il Variant, and Regulates Metabolic Genes in ESCs》
- 00:03:20 - PRC1和PRC2分别是什么
chipseq-1-表观遗传性背景知识
- 00:00:40 - ATAC-seq
- 00:01:30 - 表观遗传学的背景 2016nature methods年度技术:表观转录组分析(Epitranscriptome analysis)
和转录组联系在一起
NGS与转录
-
chipseq-2-技术的背景介绍
00:00:38 - ChIP-Seq研究蛋白质被修饰
- 00:02:38 - 什么是ChIP-Seq
-
chipseq-3-阅读综述
00:00:00 -
- 00:04:20 - 阅读超过5个公司的ChIP-Seq数据分析结题报告
- 00:04:36 - 示例文章,如何通过文章找到ChIP-Seq的数据分析流程
Fish the ChIPs: a pipeline for automated genomic annotation of ChIP-Seq data
https://pubmed.ncbi.nlm.nih.gov/21978789/
- 00:05:41 - Using MACS to Identify Peaks from ChIP-Seq Data
- 00:05:56 - Practical Guidelines for the Comprehensive Analysis of ChIP-seq Data
https://pubmed.ncbi.nlm.nih.gov/24244136/
chipseq-4-数据分析流程的提炼
- 00:00:27 - 主干和侧枝
- 00:01:10 - 三个步骤
测序数据变fastq
motif和peaks annotation
IGV非主要流程,验证
- 00:01:56 - 2013-Practical Guidelines for the Comprehensive Analysis of ChIP-seq Data
实验设计——质量过滤——比对——校正——peaks calling——显著性检验——
- 00:05:28 - 参考ppt:ChIP-seq analysis
- 00:00:00 -
- 00:07:27 - bam变为其他格式,bw、bg格式用于IGV中查看
- 00:09:16 - U2B 视频:
An introduction to ChIP-seq analysis https://www.youtube.com/watch?v=zwuUveGgmS0
ChIP-Seq Alignment, Peak Calling, and Visualization https://www.youtube.com/watch?v=XVIP_M5qEGw
- 00:11:50 - 背景洗脱非常麻烦,存在假阳性假阴性,需要结合背景对照
- 00:12:38 - ChIP-seq实验注意细节,选择什么作为control(IgG or input)
不推荐gG,原因是:第一,大多数的lgG抗体不是来源于转录因子或特定组蛋白抗体同一动物的免疫前血清。第二,lgG通常 pull down非常少的DNA,这样导致在后期的建库过程中 PCR Cycles数增加,导致不能达到作为 control去除背景噪音的目的(会缺失和放大部分信息)。
因此比较而言, Input更适合作为 control。首先 Input的建库量够,这样建库过程不需要 over-amplifed,bias小。其次,最后测序得到的数据更均匀,以及全基因组覆盖度会更好。有人提到 deletion或者 RNAi knockdown目标转录因子的细胞同时做chP-Seq作为 contro更好。
- 00:13:21 - 组蛋白修饰和转录因子结合的ChIP-Seq数据区别 需要了解
- 00:13:38 - 实例
- 00:15:03 - 阅读文献 Zebl potentiates genome-wide gene transcription with Lef1 to promote glioblastoma cell invasion
https://www.embopress.org/doi/full/10.15252/embj.201797115
- 00:15:38 - 实战:根据流程找软件
sra-tools
fastqc、multiqc、trim_galore
bowtie、bowtie2、bwa
MACS2、homer
deeptools
meme motif
annotation(R包,ChIPpeakAnno、ChIPseeker)
高阶分析
peaks差异分析
peaks对应的基因的富集分析
chipseq-5-软件安装
- 00:00:17 - 找到常规流程,搞清楚每个步骤在做什么事情
- 00:00:34 - 相关技能的学习——安装工具
- 00:00:48 - 测试数据来源:Polycomb Associates Genome-wide with a Specific RNA Polymerase ll Variant, and Regulates Metabolic Genes in ESCs
https://pubmed.ncbi.nlm.nih.gov/22305566/
- 00:01:25 - 看文章首先找到GSE号,搜索下载数据集
- 00:03:00 - RNA-seq步骤用了Tophat
- 00:03:20 - UCSC annotation, Tophat, Cufflinks计算FPKM levels
- 00:03:40 - TES和TSS(分别是什么?)
转录起始位点(Transcription Start Site, TSS):是指一个基因的5’端转录的第一个碱基,它是与新生RNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤(A或G)。
通常把转录起始位点前即5’末端的序列称为上游,而把其后即3‘末端的序列称为下游。
知识点:转录起始位点是指一个基因的5’端转录的第一个碱基。
相应的:转录终点(transcription end sites,TES)
TSS/TES 可视化 通过deeptools实现
- 00:03:56 - 找到的基因应用topGO进行富集,并利用org.Mm.eg.db(包含着每个基因对应的信息)包寻找通路
- 00:04:12 - 利用KEGG pathways进行下一步分析
- 00:05:46 - 《给学徒的WES数据分析流程》
- 00:06:07 - 给TextWrangler上色:#!/bin/bash
- 00:06:19 - 第一步,更改源为清华镜像源
- 00:06:30 - 创建名为chipseq的环境变量
- 00:07:02 - conda下安装软件
- 00:08:41 - 整个tmp可以所有人一起访问
- 00:12:12 - 安装trim-galore(不是trim_galore)
- 00:13:30 - 安装macs2、bowtie、bowtie2
- 00:14:21 - 进入R中安装R包
- 00:15:15 - 安装时的重要技巧
homer相关:《找个motif嘛,简单》
- 00:15:37 - 有些软件需要数据库支持,而有些软件数据库默认在软件目录下,homer需要先下载database才能使用
- 00:17:00 - 通过 which homer 找到homer这个软件的位置,
- 00:17:26 - homer的data位置在:*/share/homer-4.9.1-5/data/ 当中
