image.png
一元线性回归
674000874799246776.jpg
线性假定并不要求严格线性关系,自变量和因变量可通过变脸替换而转换成线性模型

内生性与外生性
12850972490789971.jpg

核心解释遍历与控制变量
image.png

关于取对数
image.png
image.png
image.png

一些笔记
224865356235753018.jpg

论文参考

养老金模型
150012891157451022.jpg
226721631349678608.jpg

SARS模型
898638850826759063.jpg
165822260271052825.jpg
478606777029129802.jpg

教育质量模型
4174739332971501.jpg
346091539435094470.jpg
676474944138012909.jpg

STATA分析

数据的描述性统计
image.png
image.png
对定性数据的描述统计如果产生大量表格,可用excel进行分析
image.png

回归语句
image.png
关注调整后的R2
image.png
image.png

标准化回归(剔除量纲影响)
衡量自变量对因变量的重要程度
image.png

检验异方差
image.png
异方差
image.png
image.png

异方差的假设检验 BP检验
image.png
image.png

怀特检验
image.png

解决异方差
image.png

使用OLS加稳健的标准误
image.png

检验多重共线性
image.png
多重共线性处理
image.png

逐步回归
image.png

逻辑回归
image.png

代码

以下代码仅用来反映内生性的危害

  1. %% 蒙特卡洛模拟:内生性会造成回归系数的巨大误差
  2. times = 300; % 蒙特卡洛的次数
  3. R = zeros(times,1); % 用来储存扰动项ux1的相关系数
  4. K = zeros(times,1); % 用来储存遗漏了x2之后,只用yx1回归得到的回归系数
  5. for i = 1: times
  6. n = 30; % 样本数据量为n
  7. x1 = -10+rand(n,1)*20; % x1在-1010上均匀分布,大小为30*1
  8. u1 = normrnd(0,5,n,1) - rand(n,1); % 随机生成一组随机数
  9. x2 = 0.3*x1 + u1; % x2x1的相关性不确定, 因为我们设定了x2要加上u1这个随机数
  10. % 这里的系数0.3我随便给的,没特殊的意义,你也可以改成其他的测试。
  11. u = normrnd(0,1,n,1); % 扰动项u服从标准正态分布
  12. y = 0.5 + 2 * x1 + 5 * x2 + u ; % 构造y
  13. k = (n*sum(x1.*y)-sum(x1)*sum(y))/(n*sum(x1.*x1)-sum(x1)*sum(x1)); % y = k*x1+b 回归估计出来的k
  14. K(i) = k;
  15. u = 5 * x2 + u; % 因为我们回归中忽略了5*x2,所以扰动项要加上5*x2
  16. r = corrcoef(x1,u); % 2*2的相关系数矩阵
  17. R(i) = r(2,1);
  18. end
  19. plot(R,K,'*')
  20. xlabel("x_1和u'的相关系数")
  21. ylabel("k的估计值")