本文档是对课程内容的简单整理。
- 前缀Z_ 为正课视频的简称,如Z1为正课视频第1课
- 前缀G_ 为更新视频的简称,如G1为更新视频第1课
回归分析的任务就是,通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
文章
D:\00000MCM\0 研究生数学建模竞赛历年真题和优秀论文集锦\研究生数学建模-优秀论文\2020年优秀论文\B题\B20103380015.pdf(SPSS 方法巧妙 自然对数处理)
0036(Python)
回归确定特征重要性 贡献度
贡献率=各个自变量的标准化系数/所有自变量标准化系数绝对值之和
多元线性回归中,如何比较各个自变量对因变量的贡献率大小?_百度知道
清风文档 标准化回归系数
标准化系数的绝对值越大,说明对因变量的影响就越大(只关注显著的回归系数哦)。
SPSS 回归操作
预处理
字符串变量转换为数值变量
转换 - 创建虚变量
(其他方法:自动重新编码 重新编码为不同/相同变量)
SPSS 中如何将字符型变量转变为数值型变量?_百度知道
SPSS中,将名义类型(定性)数据转换为度量类型(定量)数据_sydnia的博客-CSDN博客
操作
SPSS实现线性回归_sayasora的博客-CSDN博客
spss多元线性回归_SPSS教程 | 多元线性回归及SPSS操作_weixin_39834328的博客-CSDN博客
系数
取对数操作
好处:
(1)减弱数据的异方差性
(2)如果变量本身不符合正态分布,取了对数后可能渐近服从正态分布
(3)模型形式的需要,让模型具有经济学意义。
B20103380015.pdf(SPSS 方法巧妙 自然对数处理)
清风讲义 Z7 24页
SPSS-回归分析预测 - 哔哩哔哩 (一元线性回归)
1)R方与调整后的R方表示的是SSR/SST(总方差中能被回归方程所解释的部分),他的越接近1,则称两变量之间的线性相关程度越好(但不能说他们之间不相关,可能是非线性相关),一元线性回归里,相关系数平方就是R方。
2)D-W系数测试的是变量的误差项是否存在一阶自相关(自相关性是指随机误差项的各期望值之间存在着相关关系),自相关性的影响自己百度,如果d=2则基本没有自相关关系,d靠近0存在正的相关关系,d靠近4则有负的相关关系。
多重线性回归分析SPSS操作与解读 - 知乎
SPSS做线性回归分析最好的例子_GIS特战兵-CSDN博客_spss线性回归
(2)独立性。因变量各观测间相互独立,即任意两个观测的残差的协方差为0。可用Durbin-Watson检验是否存在自相关。
- 导出结果 相关性系数:表格数据复制到Excel 格式套用色阶可视化
- Durbin-Watson检验
检测异方差
检测多元共线性
SPSS后 Matlab验证 (部分数据预测)
D:\00000MCM\0 codes\2020B\q3_spsshuigui.m
SPSS得出系数 导入到Matlab验证
clear
clc
%% 加载数据
load('q3_spsshuigui')
% x
% y
% xishu
%% SPSS回归数据
% SPSS多元线性回归操作 见操作印象and语雀 多元线性回归 Z7
% SPSS系数表格copy数据到excel 需要改变单元格格式:常规 以保证小数
out = zeros(325, 1);
for i = 1:325
for j = 1:21
out(i) = out(i) + x(i, j) * xishu(j + 1);
end
out(i) = out(i) + xishu(1); % 第一个系数 常数
end
figure(1)
plot(out, '-', 'Color', [1 0.5 0], 'linewidth', 1)
hold on
plot(y, '-', 'Color', [0 0.67 1], 'linewidth', 1)
legend('legend1', 'legend2')
title('title')
ylabel('ylabel')
xlabel('xlabel')
err = out - y;
err_abs = abs(err);
figure(2)
plot(err_abs, '-')