:::info 第一个上课老师,范振鑫不给 PPT,上课主要讲 基因组概念 + 精准医疗 + 自己目前研究猕猴 + 宏基因组。除了他自己研究课题外,其余知识 B 站有的 :::
教授说上课就是吹牛,学习完全靠课后自己积累
PPT1:给定几个英文单词
Q1:什么是直系同源(Orthologous),为什么建树使用1:1
的直系同源?
PPT2:假设20个个体基因组序列
介绍生信带来的作用:
- 加快重复工作
- 快速缩小研究范围:某一耐寒植物筛选耐寒基因,从数据库中筛选出,下游继续做功能分析。
PPT3:生信出现原因?
- 更大数据量:原先测序技术贵,发的文章容易,但是烧钱,科研价值不大。但现在测序价格便宜,因此发文章若无科研价值则很难发文章。
- 生信软件:层出不穷,基本上后发的文章就diss之前发的,吹它自己最牛逼!但是对于非生信的人来说用哪个都行(不管是引用率高或期刊影响力高),但是对于生信人则要测试比对。
- 功能验证:现在很难想出别人想不到的idea,大部分都是拼工作量或者烧钱(你实验室没这钱发)
- 技术更新快:软件更新迭代速度快,一个研究周期可能很长,在当时开题时候选定的软件可能在毕业盲审的时候可能就outdated了。
- 多学科,多组学,跨学科:生信+医学等
开题:
- 提出问题:是否有价值?怎么想出来
- 怎么处理问题?方案①或②;然后实验室条件是否允许?
第二节课:
讲基因组和喝白酒,有两个酶决定你能否喝酒。乙醇xx酶
表观基因组视频:基因表达开关且会遗传下去。表观遗传:在DNA未变的情况下,具有短期或长期的可遗传效应。(DNA修饰,也就是甲基化让酶难以结合达到沉默基因或抑制基因表达。相反去甲基化就是让基因表达,但是这个过程并不是可逆的),基因表达非常复杂,而表观遗传不仅仅与DNA甲基化相关,还与microRNA等表达相关。
Q:为什么有写模式生物的研究结果放到人类上就不行?不都说共同祖先和有大部分相似序列?
- 伦理问题:无法在人身上做
- 模式生物研究周期:例如灵长类动物周期很长,还没等你研究透彻你就退休了。
现如今点突变研究技术非常成熟,但是结构变异CV,反转等大片段的改变研究技术就非常不成熟。
基因组重测序分析流程:GATK流程
非生信同学能用就行,生信同学也不要造轮子,但是要调参让结果更优。
基因组测序测量:
- 从头测序 De Novo:物种从未测序过,测出后需要进行基因组组装+注释得到基因组序列。烧钱:reads->Contig->Saffold->Chrosome
- 重测序手段:有 reference genome 则不用去预测基因结构,reads->reference gnome-(mapping)->Genotype->SNP, InDel, SV
- 最大问题:reference Genome上没有你就无法mapping,因此要选择高质量同物种(或者实在不行找进化关系比较近)的参考基因组。
目前对生信看法:
- 很多人当做工具,论文不给出具体步骤。
- 数据真实性:二代测序可能有误差,怎么验证呢?使用一代测序抽样调查测序反向验证。就怕假阳性太高了。
介绍全外显子测序技术:
Exome sequencing is especially effective in the study of rare Mendelian diseases, because it is an efficient way to identify the genetic variants in all of an individual’s genes.
step1:Target-enrichment strategies |
step2:Sequencing |
---|---|
猕猴:重要的医学模式动物
衰老机制:
- 小鼠/猴子热量摄入少可以延长寿命研究
宏基因组:肠道微生物在之前很火,什么病都可以和肠道微生物相关。到底人类基因组重要还是肠道微生物基因组重要?
基因组时代的精准医疗
PPT1:什么是精准治疗?同一种药和相同疗程,为什么每个人效果不同,也就是个体差异问题如何解决,因此精准医疗就是对特定病人对症下药。
疾病影响因素:
- 基因完全控制(内因):血友病,囊性纤维病
- 基因无法控制(外因):生活习惯问题,硅肺,肺癌。
不能盲目追寻个体数据的统计性:
- BRCA2乳腺癌易感基因突变位点,美国歌手的基因检测并不一定适合中国人,因为地区基因不同。也就是结果不具有统计学意义。
- 随着研究深入后,越来越多的突变位点被报道。