数据下载
rm(list = ls())
library(GEOquery)
gse_number = "GSE56649"
eSet <- getGEO(gse_number,
destdir = '.',
getGPL = F)
class(eSet)
length(eSet)
eSet = eSet[[1]]
提取表达矩阵
exp <- exprs(eSet)
exp[1:4,1:4]
exp = log2(exp+1)
boxplot(exp)
是否需要标准化
limma::normalizeBetweenArrays(exp)
boxplot(exp)
提取临床信息
#(2)提取临床信息
pd <- pData(eSet)
调整行名
#(3)调整pd的行名顺序与exp列名完全一致
p = identical(rownames(pd),colnames(exp));p
if(!p) exp = exp[,match(rownames(pd),colnames(exp))]
提取芯片平台编号
#(4)提取芯片平台编号
gpl_number <- eSet@annotation
save(gse_number,pd,exp,gpl_number,file = "step1output.Rdata")