A. 因子分析的概念

因子分析起源于心理学,直到20世纪60年代才发展成型。因子分析是从所研究的全部原始变量中将有关信息集中起来,通过探讨相关矩阵的内部依赖结构,将多变量综合成少数因子,以再现原始信息之间的关系。并进一步探讨产生这些相关关系的内在原因的一种多元统计分析方法。因子分析可分解为公共因子和独特因子两部分,他们客观存在,但又不能直接被测量到。

B. 因子分析求权重的合理性

水质评价模型可概括为单因子质量指数评价模型和多因子的水质综合指数评价模型。从单因子评价的计算公式(多指标综合评价算法(五):因子分析权数法 - 图1 式中 多指标综合评价算法(五):因子分析权数法 - 图2 是第 多指标综合评价算法(五):因子分析权数法 - 图3 种评价因子的实测浓度,多指标综合评价算法(五):因子分析权数法 - 图4 是第 多指标综合评价算法(五):因子分析权数法 - 图5 种评价因子的评价标准,多指标综合评价算法(五):因子分析权数法 - 图6 是第 多指标综合评价算法(五):因子分析权数法 - 图7 种因子的单项质量指数)中看到,它考虑的是某一种因子的质量状况,不能反映水质的全貌。因此,一般采用多因子的水质综合评价指数模型。

  1. 从其基本思想看加权的原始信息应当直接来自客观环境,处理这些信息的过程是深入探讨各因子间相互影响或联系的过程。
  2. 从加权的原始信息分析。第 多指标综合评价算法(五):因子分析权数法 - 图8 个因子的水质指数 多指标综合评价算法(五):因子分析权数法 - 图9 满足了四个基本条件:
    • 多指标综合评价算法(五):因子分析权数法 - 图10 的真实性,来自客观环境,是当时当地环境状态的真实记录。
    • 多指标综合评价算法(五):因子分析权数法 - 图11 是第 多指标综合评价算法(五):因子分析权数法 - 图12 种污染物在环境介质中迁移转化的结果,蕴含了各因子间的相互联系及对其的影响信息。
    • 多指标综合评价算法(五):因子分析权数法 - 图13 不变,多指标综合评价算法(五):因子分析权数法 - 图14多指标综合评价算法(五):因子分析权数法 - 图15 成正比,多指标综合评价算法(五):因子分析权数法 - 图16 越大表示该因子含量越高,超标倍数也越大。它体现了第 多指标综合评价算法(五):因子分析权数法 - 图17 种因子在“量”上对水质的影响。
    • 各因子在环境介质中的允许浓度不同,当 多指标综合评价算法(五):因子分析权数法 - 图18 不变时,多指标综合评价算法(五):因子分析权数法 - 图19多指标综合评价算法(五):因子分析权数法 - 图20 成反比,多指标综合评价算法(五):因子分析权数法 - 图21 越小,多指标综合评价算法(五):因子分析权数法 - 图22 越大,污染越重。它体现了第 多指标综合评价算法(五):因子分析权数法 - 图23 种因子在“质”上对水质的影响。

由于多指标综合评价算法(五):因子分析权数法 - 图24多指标综合评价算法(五):因子分析权数法 - 图25 从“质” 与 “量” 上控制着各因子对水质的影响。因此,用 多指标综合评价算法(五):因子分析权数法 - 图26 作为加权的原始信息显然是合理的。

  1. 综合来看。因子分析是根据现象讨论其内在联系。就水质评价而言,这种现象恰恰是无量纲化的 多指标综合评价算法(五):因子分析权数法 - 图27 ,而其内在联系,也即各要素间的相互影响及其对水质的相对重要性,就是所需的权重。

C. 因子分析运算过程步骤
  1. 计算相关矩阵R
    设有n个水样,每个水样测得p个变量(评价指标),原始数据矩阵 多指标综合评价算法(五):因子分析权数法 - 图28多指标综合评价算法(五):因子分析权数法 - 图29 是指第 多指标综合评价算法(五):因子分析权数法 - 图30 水样第 多指标综合评价算法(五):因子分析权数法 - 图31 个评价指标的单项质量指数),用这些单因子的水质指数,求相关矩阵 多指标综合评价算法(五):因子分析权数法 - 图32多指标综合评价算法(五):因子分析权数法 - 图33 是各因子间的相关系数):

多指标综合评价算法(五):因子分析权数法 - 图34

  1. 用 Jacob 雅克比方法求相关阵 R的特征值和特征向量,多指标综合评价算法(五):因子分析权数法 - 图35 特征值按大小顺序排列,特征向量 多指标综合评价算法(五):因子分析权数法 - 图36 也按相应的次序排列。
  2. 求主因子个数M
    给定一个靠近1的数值PD,取前M个主因子,使其累计贡献率 多指标综合评价算法(五):因子分析权数法 - 图37
  3. 求主因子多指标综合评价算法(五):因子分析权数法 - 图38 的因子载荷矩阵 A
    多指标综合评价算法(五):因子分析权数法 - 图39
    多指标综合评价算法(五):因子分析权数法 - 图40 按行规格化得 多指标综合评价算法(五):因子分析权数法 - 图41
  4. 对规格化后的因子载荷矩阵 多指标综合评价算法(五):因子分析权数法 - 图42 施行方差最大的正交旋转。
  5. 计算因子得分
    多指标综合评价算法(五):因子分析权数法 - 图43
    多指标综合评价算法(五):因子分析权数法 - 图44 是第 多指标综合评价算法(五):因子分析权数法 - 图45个主因子对第 多指标综合评价算法(五):因子分析权数法 - 图46 个变量的得分值。
  6. 求权重
    权系数 多指标综合评价算法(五):因子分析权数法 - 图47 其中 多指标综合评价算法(五):因子分析权数法 - 图48 是第 多指标综合评价算法(五):因子分析权数法 - 图49个主因子 多指标综合评价算法(五):因子分析权数法 - 图50 的贡献率(特征值所占的百分比),计算时 多指标综合评价算法(五):因子分析权数法 - 图51 取其绝对值。
    权重
    多指标综合评价算法(五):因子分析权数法 - 图52

D. 用因子分析法求权重的实例

从上面的水质评价模型的分析与探讨知,因子分析法求权重是较为理想的。下面就黄石市地下水的21个水样(各水样都已做水质分析)用上述因子分析法的步骤求权重举例。

计算步骤及结果

  1. 选择评价参数和评价标准
  2. 根据公式 多指标综合评价算法(五):因子分析权数法 - 图53 (式中 多指标综合评价算法(五):因子分析权数法 - 图54多指标综合评价算法(五):因子分析权数法 - 图55 个水样第 多指标综合评价算法(五):因子分析权数法 - 图56 种评价因子的实际浓度,多指标综合评价算法(五):因子分析权数法 - 图57 指第 多指标综合评价算法(五):因子分析权数法 - 图58 种评价因子的评价标准,多指标综合评价算法(五):因子分析权数法 - 图59多指标综合评价算法(五):因子分析权数法 - 图60 个水样第 多指标综合评价算法(五):因子分析权数法 - 图61 种评价因子的单项质量指数),计算各水样的单项质量指数(表2):
  3. 用因子分析程序依次计算地下水样的相关矩阵(表3),因子分析的贡献及相应的累计贡献大于0.8的前5个主因子(表4),前5个主因子的权系数(表5)。



    再通过下式计算,可得到评价参数的权系表(表6)。
    $$
    \betaj=A{1j}f1+A{2j}f2+A{3j}f3+A{4j}f4+A{5j}f5
    \space\space\space\space\space
    (A
    {ij}\text{取其绝对值})
    $$
    再由式 $Wj=\frac{\beta_j}{\sum^p{j=1}\beta_j}$ 可计算每个评价参数的实际权重,结果见表6.
    $$
    \beta_1=1.047_0.3870648+0.3338_0.1956239+\cdots+0.087*0.0752031=0.579
    $$

因子分析所得权重的结果分析

从表6可以看出影响地下水的主要因子为固形物、总硬度、$\text{SO}_4^{2-}$。它们三者的整体贡献达 92.957%,其次是受 FeAs、$\text{Cl}-$、Mn等因子的影响,其余 $\text{NO}_2^-$、CrZn都在0.5%以下,权重很小。因子分析所给予的各评价参数的权重都较实际地反映了其本身的权重。但个别水样1、7、21与实际不符,从表2可知,水样1和21种的Cr分别超标了1.2倍和11.2倍。Cr是毒理学指标,对人体的消化系统由刺激和腐蚀性,六价 Cr有致癌作用。另外,水样7的 $\text{NO}_2^-$ 超标了12倍,$\text{NO}_2^-$ 也是毒理学指标。它与高铁血红蛋白结合会减少血的氧气输送,使人体中毒,严重的甚至死亡。只要这些因子超标,水就受到了污染,而因子分析给予它的权重很小,这时对个别水样需运送单项质量指数评价。由此说明权重不仅考虑到其危害程度,也考虑到其影响的幅度。尽管不同因子间的拮抗、协同作用难以解释,但目前来看,用因子分析法求权重作为水质评价模型是合适的。