回归分析是用来确定变量之间关系的方法。如果只有一个因变量,且因变量和自变量之间的关系是现行的,就叫做一元线性回归。
    模型: Y=βX+ε (向量形式) β为回归系数,ε为残差
    模型假设:①每个自变量都服从正态分布,且相互独立(即不存在共线性)
    ②残差之间相互独立
    ③残差均服从均值为零的正态分布,且满足方差齐性
    参数估计:最小二乘估计,即β是满足∑(y-βx)最小的β,可以通过求导得到
    判断拟合优度的指标:R²、MSE(均方误差)
    假设检验:①对回归方程的检验 H0:β=0 (F统计量)
    ②对回归系数的检验 H0:β=0 (t统计量)
    残差分析:对于残差的独立性和正态性检验,看是否符合模型假设
    代码示例:

    1. x1 <- rnorm(20,mean = 5,sd = 1)
    2. x2 <- rnorm(20,mean = 10,sd = 1)
    3. y <- 3*x1+4*x2+rnorm(20,mean = 0,sd = 1)
    4. data1 <- data.frame('x1'=x1,'x2'=x2,'y'=y)
    5. fit1 <- lm(y~x1+x2-1,data=data1)
    6. #查看拟合结果
    7. summary(fit1)
    8. #残差图
    9. par(mfrow=c(2,2))
    10. plot(fit1)