线性回归 - 《智众医疗数据分析》

回归分析是用来确定变量之间关系的方法。如果只有一个因变量，且因变量和自变量之间的关系是现行的，就叫做一元线性回归。
模型： Y=βX+ε （向量形式） β为回归系数，ε为残差
模型假设：①每个自变量都服从正态分布，且相互独立（即不存在共线性）
②残差之间相互独立
③残差均服从均值为零的正态分布，且满足方差齐性
参数估计：最小二乘估计，即β是满足∑(y-βx)最小的β，可以通过求导得到
判断拟合优度的指标：R²、MSE（均方误差）
假设检验：①对回归方程的检验 H0：β=0 （F统计量）
②对回归系数的检验 H0：β=0 （t统计量）
残差分析：对于残差的独立性和正态性检验，看是否符合模型假设
代码示例：

x1 <- rnorm(20,mean = 5,sd = 1)
x2 <- rnorm(20,mean = 10,sd = 1)
y <- 3*x1+4*x2+rnorm(20,mean = 0,sd = 1)
data1 <- data.frame('x1'=x1,'x2'=x2,'y'=y)
fit1 <- lm(y~x1+x2-1,data=data1)
#查看拟合结果
summary(fit1)
#残差图
par(mfrow=c(2,2))
plot(fit1)