- 市面上现有的各种测序设备
- 关于测序相关的内容可以参见https://www.yuque.com/mugpeng/nwmnq7/psqegc
高通量测序在精准医学的应用
1)发现新的基因疾病
2)基因组学筛查,发现遗传病(新生儿遗传病筛查)
3)辅助精准医学(根据乳腺癌基因突变制订治疗策略)
- 查看医师前进行基因筛查
- mammaPrint test
生物信息学面临的挑战
1. 测序错误
对于多个相同碱基序列(homopolymer)的测定,有时会无法准确识别数目。(光信号强度衰减)
测序对于GC 序列存在偏差,也会影响最终的结果。
校正方法:
2.计算成本
3.数据储存与可视化
从头测序
de novo sequencing,测定物种序列没有已知序列。
de bruijn graph,采用哈希表的方法,直接将大量的序列信息切割为三个三个的序列片段(这样一大段长的序列就绝对会有重复的组合),每个片段向后错一位,通过搜寻两两的相同内容可以搜寻下一个片段,这样可以节省存储的空间。牺牲了read 连接信息,降低了存储。对于重复序列
的组装也难以测得。
重测序
resequencing,对已知序列物种进行测序。(肿瘤基因测序比对)
可视化的结构变异
转录组测序
通过常规基因组测序,可以通过测定read 强度,间接得知基因的表达量高低。
测定转录本
同一个基因可能有很多个转录信号
表观基因组学
chIPseq
判定转录调控因子结合到的基因调控部位。
- 首先捕获某一个特定的蛋白质。该蛋白可能结合了一段DNA(保护了这段DNA)。
- 使用DNA酶将未结合的DNA 降解掉。
- 将蛋白洗脱,将没有降解的DNA 测序建库。把序列回测到基因组序列上,则序列所在的部位即会有蛋白的结合。可以进一步确定具体的蛋白结合部位,并判定下游调控基因。
- ChIPseq 方法
甲基化测定
bisulfite 盐可以将甲基化的胞嘧啶转换为胸腺嘧啶。比较处理前后序列,C 与T 转换的便是甲基化的序列。
组学问题
古基因组学
- 毛发DNA 更容易受到保护