1.统计数据的分析方法
统计数据的分析方式一般分为描述统计和推断统计。即一般为参数估计和假设检验
1.1 描述统计
1.2 推断统计
是一种研究如何利用样本推断总体特征的统计方法
2.统计数据的类型
2.1 按照计量尺度分类
- 分类数据:不同标记仅仅为了区分不同类别。不同类别之间没有趋势、大小之分。如:性别男和女。
- 顺序数据:不同标记可区分不同类别。但不同类别之间有趋势、大小之分。如:学历初中、高中、大专、本科、研究生等
-
2.2 计量尺度的分类
分类尺度:按照事物的属性进行平行分类的尺度,表现为无序的分类;
- 顺序尺度:按照事物顺序类别的尺度进行分类,表现为有序的分类;
- 间隔尺度:对事物类别或次序之间间距的测量尺度,没有绝对零点,数据表现为数字。如温度;
- 比率尺度:对事物类别或次序之间间距的测量尺度,有绝对零点,数据表现为数字。如速度。
3.几个基本的统计学概念
3.1 总体和样本
- 总体:包含所有被研究个体的集合
- 统计数据的第一步就是确定研究的总体是什么,一般根据研究的目的来进行确定;
- 总体根据数量不同可以分为有限总体和无限总体。有限总体和无限总体最大区别就是在进行个体抽样时每个个体被抽到的概率不同。
- 样本:从总体中抽样出一部分元素的集合;
-
3.2 参数和统计量
参数:用于描述总体特征的概括性度量。μ、σ、π
-
3.3 变量
变量:说明现象某种特征的概念,每次取值可能不同;
- 变量值:变量的取值

4.数据的收集
4.1 调查数据
- 在调查数据中,一般离不开对数据的抽样。对于数据的抽样一般分为概率抽样和非概率抽样;
- 概率抽样适合定量研究,而非概率抽样更加适合探索性的研究
4.2 实验数据
- 实验数据是在控制变量的基础上获得的数据。实验是检验因果关系的一种方式
- 实验组和对照组的的 A/B Test
5.数据的误差
- 数据的误差就是调研结果和真实结果之间的差异。一般分为:抽样误差和非抽样误差两类;
- 抽样误差是由抽样随机性引起的误差
- 抽样误差和样本量呈反比,即抽样误差可以通过增加样本量的方式减小;
- 抽样误差和总体的变异性呈反比。总体变异越小,抽样误差也就越小。
- 非抽样误差本质可以理解为错误。
- 非抽样误差的构成一般为:抽样框误差、回答误差、无回答误差、调查员误差、测量误差;
- 通过控制调查的过程质量可以降低非抽样误差
