回归分析是用来确定变量之间关系的方法。如果只有一个因变量,且因变量和自变量之间的关系是现行的,就叫做一元线性回归。
模型: Y=βX+ε (向量形式) β为回归系数,ε为残差
模型假设:①每个自变量都服从正态分布,且相互独立(即不存在共线性)
②残差之间相互独立
③残差均服从均值为零的正态分布,且满足方差齐性
参数估计:最小二乘估计,即β是满足∑(y-βx)最小的β,可以通过求导得到
判断拟合优度的指标:R²、MSE(均方误差)
假设检验:①对回归方程的检验 H0:β=0 (F统计量)
②对回归系数的检验 H0:β=0 (t统计量)
残差分析:对于残差的独立性和正态性检验,看是否符合模型假设
代码示例:
x1 <- rnorm(20,mean = 5,sd = 1)
x2 <- rnorm(20,mean = 10,sd = 1)
y <- 3*x1+4*x2+rnorm(20,mean = 0,sd = 1)
data1 <- data.frame('x1'=x1,'x2'=x2,'y'=y)
fit1 <- lm(y~x1+x2-1,data=data1)
#查看拟合结果
summary(fit1)
#残差图
par(mfrow=c(2,2))
plot(fit1)