本文档是对课程内容的简单整理。

  • 前缀Z_ 为正课视频的简称,如Z1为正课视频第1课
  • 前缀G_ 为更新视频的简称,如G1为更新视频第1课

回归分析的任务就是,通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
image.png
image.png

文章
D:\00000MCM\0 研究生数学建模竞赛历年真题和优秀论文集锦\研究生数学建模-优秀论文\2020年优秀论文\B题\B20103380015.pdf(SPSS 方法巧妙 自然对数处理)
0036(Python)

回归确定特征重要性 贡献度

贡献率=各个自变量的标准化系数/所有自变量标准化系数绝对值之和
多元线性回归中,如何比较各个自变量对因变量的贡献率大小?_百度知道

清风文档 标准化回归系数
标准化系数的绝对值越大,说明对因变量的影响就越大(只关注显著的回归系数哦)。

SPSS 回归操作

预处理
字符串变量转换为数值变量
转换 - 创建虚变量
(其他方法:自动重新编码 重新编码为不同/相同变量)
SPSS 中如何将字符型变量转变为数值型变量?_百度知道
SPSS中,将名义类型(定性)数据转换为度量类型(定量)数据_sydnia的博客-CSDN博客

操作
SPSS实现线性回归_sayasora的博客-CSDN博客
spss多元线性回归_SPSS教程 | 多元线性回归及SPSS操作_weixin_39834328的博客-CSDN博客
系数

取对数操作
好处:
(1)减弱数据的异方差性
(2)如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布
(3)模型形式的需要,让模型具有经济学意义。
B20103380015.pdf(SPSS 方法巧妙 自然对数处理)
清风讲义 Z7 24页

SPSS-回归分析预测 - 哔哩哔哩 (一元线性回归)
1)R方与调整后的R方表示的是SSR/SST(总方差中能被回归方程所解释的部分),他的越接近1,则称两变量之间的线性相关程度越好(但不能说他们之间不相关,可能是非线性相关),一元线性回归里,相关系数平方就是R方。
2)D-W系数测试的是变量的误差项是否存在一阶自相关(自相关性是指随机误差项的各期望值之间存在着相关关系),自相关性的影响自己百度,如果d=2则基本没有自相关关系,d靠近0存在正的相关关系,d靠近4则有负的相关关系。

多重线性回归分析SPSS操作与解读 - 知乎
SPSS做线性回归分析最好的例子_GIS特战兵-CSDN博客_spss线性回归
(2)独立性。因变量各观测间相互独立,即任意两个观测的残差的协方差为0。可用Durbin-Watson检验是否存在自相关。

  • 导出结果 相关性系数:表格数据复制到Excel 格式套用色阶可视化
  • Durbin-Watson检验

检测异方差
检测多元共线性

SPSS后 Matlab验证 (部分数据预测)

D:\00000MCM\0 codes\2020B\q3_spsshuigui.m
SPSS得出系数 导入到Matlab验证

  1. clear
  2. clc
  3. %% 加载数据
  4. load('q3_spsshuigui')
  5. % x
  6. % y
  7. % xishu
  8. %% SPSS回归数据
  9. % SPSS多元线性回归操作 见操作印象and语雀 多元线性回归 Z7
  10. % SPSS系数表格copy数据到excel 需要改变单元格格式:常规 以保证小数
  11. out = zeros(325, 1);
  12. for i = 1:325
  13. for j = 1:21
  14. out(i) = out(i) + x(i, j) * xishu(j + 1);
  15. end
  16. out(i) = out(i) + xishu(1); % 第一个系数 常数
  17. end
  18. figure(1)
  19. plot(out, '-', 'Color', [1 0.5 0], 'linewidth', 1)
  20. hold on
  21. plot(y, '-', 'Color', [0 0.67 1], 'linewidth', 1)
  22. legend('legend1', 'legend2')
  23. title('title')
  24. ylabel('ylabel')
  25. xlabel('xlabel')
  26. err = out - y;
  27. err_abs = abs(err);
  28. figure(2)
  29. plot(err_abs, '-')