目的:下游分析、数据挖掘、单细胞
    时间:3周 【周三、日除外】*3h
    计划:

    • 5.23-5.28 R
    • 5.30-6.4 R+GEO
    • 6.6-6.11 转录组下游分析(TCGA)+单细胞

    WechatIMG206.png

    具体内容
    第一周R语言

    • R语言数据类型与数据结构
    • 函数与R包
    • 文件读写
    • R语言作图
    • 拓展补充部分

    第二周GEO数据挖掘
    GEO数据库介绍
    数据下载和质控
    样本分类与芯片注释获取
    差异分析和富集分析
    多分组数据处理和多数据集处理
    蛋白互作网络绘制
    第三周Linux
    服务器登录和Linux操作系统认知,基本文本文件及目录操作
    文本处理三驾马车(awk,sed,grep)实战演练,基于gencode数据库human的gtf文件
    conda管理生物信息学软件,环境变量
    相对路径和绝对路径,通配符及参数扩展,快捷方式
    批处理和脚本编程

    第四周RNA-seq实战

    生物信息学常见数据格式:fastq,fasta,sam,bam,vcf,gtf
    转录组背景知识
    转录组上游流程:文献测序数据下载到质控,比对,定量,拿到表达矩阵
    转录组下游分析:3大R包走转录组表达矩阵的差异分析,富集分析,GSEA
    其它NGS组学介绍


    文稿内容源于公众号:生信技能树