数据下载

    1. rm(list = ls())
    2. library(GEOquery)
    3. gse_number = "GSE56649"
    4. eSet <- getGEO(gse_number,
    5. destdir = '.',
    6. getGPL = F)
    7. class(eSet)
    8. length(eSet)
    9. eSet = eSet[[1]]

    提取表达矩阵

    1. exp <- exprs(eSet)
    2. exp[1:4,1:4]
    3. exp = log2(exp+1)
    4. boxplot(exp)

    是否需要标准化

    1. limma::normalizeBetweenArrays(exp)
    2. boxplot(exp)

    提取临床信息

    1. #(2)提取临床信息
    2. pd <- pData(eSet)

    调整行名

    1. #(3)调整pd的行名顺序与exp列名完全一致
    2. p = identical(rownames(pd),colnames(exp));p
    3. if(!p) exp = exp[,match(rownames(pd),colnames(exp))]

    提取芯片平台编号

    1. #(4)提取芯片平台编号
    2. gpl_number <- eSet@annotation
    3. save(gse_number,pd,exp,gpl_number,file = "step1output.Rdata")