统计学-2数据搜集.png

0x01 数据的来源

一.调查或实验

二.间接

  • 对原有信息加工,整理
  • 系统外部
  • 系统内部
  • 二手资料评估

    • 搜集者的实力和社会信誉度
    • 搜集目的:集团利益?
    • 如何搜集
    • 何时搜集?是否过时?
    • 资料相关性
    • 数据口径,数据定义,数据准确度
    • 引用注明来源

      三.直接

      1.调查

  • 调查数据

  • 社会现象
  • 有限总体
  • 关键在于抽取好样本

    • 样本要是针对研究问题
    • 调查费用与估计精度平衡

      2.实验

  • 实验数据

  • 自然现象

    0x02 调查方法

    一.概率抽样(随机抽样)

    1.注意

  • 抽样按照一定概率以随机原则抽取样本

    • 排除主观因素
    • 随机不是随便
  • 样本抽中概率已知,可计算
  • 用样本估计总体,要考虑样本被抽中概率
  • 样本间被抽中概率可以相同,也可以不同
  • 对总体参数估计

    2.分类

    (1)简单随机抽样

  • N个总体的中,随机,逐个抽取n个

  • 等概率
  • 简单,基本
  • 实际局限

    • N太大
    • 抽取分散

      (2)分层抽样

  • 抽样单位根据特征或规则分层,从不同层中,随机抽样

  • 对总体和各层参数估计

    (3)整群抽样

  • 对总体中部分合并成群,抽取一整个群

  • 估计精度差,误差大
  • 方便,便宜

    (4)系统抽样

  • 总体排序,规定范围选取一个起点,之后根据一定间隔抽取其它

  • 1˜k中选取r,之后选取r+k,r+2k等
  • 操作简单,方差估计难

    (5)多阶段抽样

  • 整群抽样后,选取群中若干单位,继续划群取部分

  • 样本集中,便宜;大规模适用

    二.非概率抽样

    1.注意

  • 不随机

  • 探索性研究
  • 操作简便,时效快,成本低

    2.分类

    (1)方便抽样

  • 方便执行,随意

  • 不可总体估计推断,但可建立初步认识或建立假设

    (2)判断抽样

  • 根据经验,判断,有目的人为选取,不可推断总体

  • 重点抽样
    • 重点代表全部
  • 典型抽样
    • 典型揭示本质特征
  • 代表抽样

    • 代表与全部

      (3)自愿样本

  • 人群特定,感兴趣

  • 右偏样本
  • 不可总体推断
  • 提供有价值信息,反映某类看法

    (4)滚雪球抽样

  • 选取部分人,再由样本推荐其它人,继续调查

  • 对特定群体的调查

    (5)配额抽样

  • 先分层,每个层用方便抽样或判断抽样

  • 分层:单一变量(仅年龄)或交叉变量(年龄+性别)

    3.搜集数据方法

  • 自填式

  • 面访式
  • 电话式

    0x03 实验方法

  • 实验组和对照组

  • 实验中问题
    • 人的意愿
    • 心理问题
    • 道德问题
  • 实验中统计
  • 实验法案例

    0x04 数据误差

    1.抽样误差

    2.非抽样误差

  • 抽样框误差

即总体的误差

  • 回答误差
    • 理解误差
    • 记忆误差
    • 有意识误差
  • 无回答误差
  • 调查员误差
  • 测量误差

    3.误差控制

    各个针对
    _