• https://blog.csdn.net/xiangmin_meng/article/details/22402545
    这里以一元线性回归为例。
    对于单因素方差分析,一共有两个变量,一个是定类变量/因素的水平(X),一个是定量变量(Y)。比如,比较3种植物的花鄂长度差异,植物就是定类变量,有3个取值;花萼长度就是定量变量。【带着思考:前一个变量为什么用X?后一个变量为什么用Y?这个跟回归表达式有关,也是我琢磨了很久才反应过来,才记牢固】">转 https://blog.csdn.net/xiangmin_meng/article/details/22402545
    这里以一元线性回归为例。
    对于单因素方差分析,一共有两个变量,一个是定类变量/因素的水平(X),一个是定量变量(Y)。比如,比较3种植物的花鄂长度差异,植物就是定类变量,有3个取值;花萼长度就是定量变量。【带着思考:前一个变量为什么用X?后一个变量为什么用Y?这个跟回归表达式有关,也是我琢磨了很久才反应过来,才记牢固】

    https://blog.csdn.net/xiangmin_meng/article/details/22402545
    这里以一元线性回归为例。
    对于单因素方差分析,一共有两个变量,一个是定类变量/因素的水平(X),一个是定量变量(Y)。比如,比较3种植物的花鄂长度差异,植物就是定类变量,有3个取值;花萼长度就是定量变量。【带着思考:前一个变量为什么用X?后一个变量为什么用Y?这个跟回归表达式有关,也是我琢磨了很久才反应过来,才记牢固】

    再看一下线性回归的表达式,也是两个变量,一个是自变量(X),一个是因变量(Y)。比如体重对身高的影响。对于线性回归来讲,自变量和因变量都是连续型的。

    如果将线性回归中的两个变量与方差分析中的两个变量比较一下,可以发现他们是一致的。方差分析中的定量变量(Y)实际上就是线性回归中的因变量(Y),方差分析中的定类变量(X)就是线性回归中的自变量(X)。这两个方法的目的都是为了看自变量(定类变量)对因变量(定量变量)的影响。如上面所说的,目的就是为了看药物对血压的影响,体重对肺活量的影响。
    比较一下,可以发现,线性回归和方差分析的结果变量是一样的,都是连续型资料,而自变量就不一样了,方差分析中是定量变量,而线性回归中是定量变量。但他们都可以统一到一个大的范畴中,即一般线性模型。
    其实如果把方差分析的形式改一下,大家可能就更容易理解了。一般的方差分析的数据大都列成这样的形式: | A | B | C | | —- | —- | —- | | 12 | 16 | 32 | | 14 | 17 | 23 | | 15 | 17 | 28 |

    如果A、B、C分别用1、2、3来表示,列成下面的格式: | y | x | | —- | —- | | 12 | 1 | | 14 | 1 | | 15 | 1 | | 16 | 2 | | 17 | 2 | | 17 | 2 | | 32 | 3 | | 23 | 3 | | 28 | 3 |

    怎么样,这种形式跟线性回归的形式差不多了吧?y就是因变量,x就是自变量。唯一与线性回归不同的地方是:线性回归中的x和y是一一对应的,而这里的x和y是一对多的,即1个x对应多个y值,但这不影响分析。其实即使在线性回归中,偶尔也会出现一对多的现象的。比如体重对肺活量的影响,如果有好几个人体重相同而肺活量不同,就出现了一对多的现象。这就跟方差分析更像了。

    最后加点总结性的、理论性的东西,一般线性模型的形式大致可以这样:
    y=α+βx+ε,

    这个其实大家都应该很熟悉了,在统计教材中的线性回归章节中一般都有这个公式。这里的y就是因变量,x就是自变量,但是这里需要注意的就是,x是分类变量的时候,就变成了方差分析的形式了,当x是连续型变量的时候,就变成了线性回归的形式了。

    总之,正如哲学中内容与形式的原理,一般线性模型是内容,x的变化则显示了其不同的形式,但无论如何,它们的内容都是一般线性模型。