chIPseq-6-公共数据的获取

从网站找到数据ID

  • 00:03:01 - 下载sra并且转换为 fastq

利用prefetch

  • 00:05:19 - 安装prefetch,可以下载源码安装
  • 00:07:04 - prefetch=prefetch
  • 00:08:16 - 创建一系列文件夹 mkdir {sra,raw,clean,align,peaks,motif,qc}

sra
raw 将sra转为rawdata
clean rawdata过滤进行clean
align 过滤后比对
peaks
motif
qc

  • 00:00:00 - vim或cat命令创建 srr.list文件
  • 00:00:00 - 只有理解了SRA数据库,才能够理解公共数据集
  • 00:00:00 - chipseq操作笔记:
  • 00:13:06 - 安装Rstudio必备软件
  • 00:15:32 - 下载Runinfo Table
  • 00:15:58 - 直接将服务器上的SRA数据链接过去

ln -s /public/project/epi/*/sra sra

  • 00:17:33 - 只有理解了SRA数据库,才懂得如何利用公共数据集
  • 00:17:42 - 对sra.table进行转换
  • 00:17:57 - 将每一列转换为每一行

    1. head -1 sra.table |tr '\t' '\n'| cat -n
  • 00:18:05 - 选择SRA_Sample列

  • 00:18:45 - SRR文件名本身没有意义,需要转换为library_Name
  • 00:19:30 - 选择第4,8列

    cut -f 4,8 sra.table
    
  • 00:20:08 - 存在可能性:样本分两次上传

  • 00:00:00 - 对样本进行改名预处理:

    cut -f 4,8 sra.table |cut -d":" -f 2 |tr '' '-'
    

    chipseq-7-得到fastq格式测序数据

  • 00:00:00 -

  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -
  • 00:00:00 -