从jmzeng处获得服务器账号密码

安装conda环境

原本尝试:

  1. wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

操作发现远程服务器下载速度感人,将sh安装包先下载到本地,再上传到jmz服务器上,继续安装:

# 接下来使用bash命令来运行我们下载的文件,记得是一路yes下去
bash Miniconda3-latest-Linux-x86_64.sh 
#  安装成功后需要更新系统环境变量文件
source ~/.bashrc

在尝试更换镜像源时,服务器报错:

conda: command not found

查询资料得知是因为~/.bashrc文件没有配置好,解决方案:

vim ~/.bashrc
# 在最后一行加上
export PATH=$PATH:/home/data/t040257/miniconda3

接下来基于既往历史教训,设置北外的镜像源(被清华镜像源伤害多次)

conda config --add channels r 
conda config --add channels conda-forge 
conda config --add channels bioconda
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/

安装chipseq小环境

conda create -n chipseq python=2 bwa
conda info --envs
# conda environments:
#
base                  *  /home/data/t040257/miniconda3
chipseq                  /home/data/t040257/miniconda3/envs/chipseq
source activate chipseq

安装软件

conda install -y sra-tools fastqc multiqc 
conda install -y trim-galore samtools
conda install -y deeptools homer meme
conda install -y macs2 bowtie bowtie2

homer相关

# data存放位置
(chipseq) t040257@biot2-PowerEdge-R840:~/miniconda3/envs/chipseq/share/homer-4.9.1-5/data$ ls -lh
total 12K
drwxrwxr-x 2 t040257 t040257 4.0K 11月 16 15:44 accession
drwxrwxr-x 2 t040257 t040257 4.0K 11月 16 15:44 GO
drwxrwxr-x 9 t040257 t040257 4.0K 11月 16 15:44 knownTFs

下载sra并且转换为fastq

# 找到prefetch的位置
which prefetch
/home/data/t040257/miniconda3/envs/chipseq/bin/prefetch
# 进入chipseq小环境后
prefetch=prefetch
# 新建一个文件夹
mkdir -p ~/project/epi/
cd ~/project/epi/
# 新建以下目录
mkdir {sra,raw,clean,align,peaks,motif,qc}
cd sra 
# vim 或者cat命令创建 srr.list 文件
cat >srr.list
SRR391032
SRR391033
SRR391034
SRR391035
SRR391036
SRR391037
SRR391038
SRR391039
SRR391040
SRR391041
SRR391042
SRR391043
SRR391044
SRR391045
SRR391046
SRR391047
SRR391048
SRR391049
SRR391050
cat srr.list |while read id;do $prefetch $id;done
# 查看命令在后台运行的情况
ps -ef |grep pref
## 默认下载目录(自行创建):~/ncbi/public/sra/ 
ls -lh ~/ncbi/public/sra/

这个部分下载非常耗时,prefetch命令在关闭本地设备以后第二天访问服务器,发现没有完成下载任务

安装Rstudio必备R包

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
install.packages("devtools",
               repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")
library(devtools) 
source("https://bioconductor.org/biocLite.R") 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")  
BiocInstaller::biocLite(c('airway','DESeq2','edgeR','limma'))
BiocInstaller::biocLite(c('ChIPpeakAnno','ChIPseeker'))
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg19.knownGene',
                        ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg38.knownGene',
                        ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Mmusculus.UCSC.mm10.knownGene',
                        ask=F,suppressUpdates=T)
# 值得注意的是Y叔的包检查会有版本的问题,包括 ChIPseeker                              
library(TxDb.Hsapiens.UCSC.hg19.knownGene) 
library(TxDb.Mmusculus.UCSC.mm10.knownGene) 
library(TxDb.Hsapiens.UCSC.hg38.knownGene) 
library(ChIPpeakAnno) 
library(ChIPseeker)

使用fastdump命令

dump='/home/data/t040257/miniconda3/envs/chipseq/bin/fastq-dump'
dump=fastq-dump
## 下面需要用循环
analysis_dir=raw
cat config|while read id;
do echo $id
arr=($id)
srr=$(arr[1])
sample=${arr[0]}
# 单端测序数据的sra转fastq
$dump -A $sample -O $analysis_dir --gzip --split-3
~/ncbi/public/sra/$srr.sra
done