数据下载
rm(list = ls())library(GEOquery)gse_number = "GSE56649"eSet <- getGEO(gse_number,destdir = '.',getGPL = F)class(eSet)length(eSet)eSet = eSet[[1]]
提取表达矩阵
exp <- exprs(eSet)exp[1:4,1:4]exp = log2(exp+1)boxplot(exp)
是否需要标准化
limma::normalizeBetweenArrays(exp)boxplot(exp)
提取临床信息
#(2)提取临床信息pd <- pData(eSet)
调整行名
#(3)调整pd的行名顺序与exp列名完全一致p = identical(rownames(pd),colnames(exp));pif(!p) exp = exp[,match(rownames(pd),colnames(exp))]
提取芯片平台编号
#(4)提取芯片平台编号gpl_number <- eSet@annotationsave(gse_number,pd,exp,gpl_number,file = "step1output.Rdata")
