基本概念

1. 分类型数据

  1. 定义:对事物进行分类的结果。例如:人口按性别分为男、女两类
  2. 特点:数据表现为类别,用文字来表述

    2. 顺序性数据

  3. 定义:对事物类别顺序的测度。例如:产品分为的一等品、二等品、三等品

  4. 特点:数据表现为类别,用文字表述

    3. 数值型数据(定量数据)

  5. 定义:对事物的精确测度。例如:身高175cm,168cm

  6. 特点:结果表现为具体的数字

重要规律:低级数据的方法高级数据可以用,但高级数据的方法低级数据不可以用

4. 参数和统计量

  1. 参数(parameter)

指研究者想要了解的总体的某种特征值,常见有总体均值(μ)、标准差()、总体比例(π)

  1. 统计量(statistic)

指根据样本数据计算出来的一个量,即样本的某个特征值。常见的有样本均值(x)、样本标准差(s)、样本比例(p)

描述统计

撰写数据报告

1. 五个角度

  • 总体规模描述—总量指标
  • 对比关系描述—相对指标
  • 集中趋势描述—平均指标
    • 众数—分类数据
    • 分位数—顺序数据
    • 均值—数值型
  • 离散程度描述—变异指标
    • 极差
    • 平均差
    • 方差和标准差
    • 变异系数—标准差与均值之比
  • 分布形态描述—偏态与峰态

    2. 常用分布

  1. 两点分布
  2. 二项分布
  3. 正态分布
  4. 标准正态分布
  5. 卡方分布(X^2)
  6. t分布
  7. F分布