统计分析的目的
收集数据、整理分析数据和由数据,
手段:
描述性统计:利用表格/图形或者数值(数值特征)来展示和刻画数据中的信息
表象特征
推断性统计:对上面的描述性数据,进行估计和检验。
表象特征的真实的概率
统计学的本质
人工智能:统计学,机器学习,深度学习
统计学:通过抽样去推断整体特征,
首先分析总体的特征
总体数量太多,所以只能抽取数据(抽样),根据抽样的样本,来推测整体存在的特征。
推断的结果,需要进行检验和估计,所以统计学会有一个p值概率
机器学习,没有p值
统计学要学习:抽样方法、推断的方法、计算误差的方法
抽样:有科学地抽样
推断
假设检验
统计分析的关键概念
4种测量尺度
集中趋势
离散趋势
4种测量尺度:
定类测量尺度:例如:性别——频数分布表
功能:分类
定序测量尺度:例如:喜欢的宠物顺序——频数分布表,
功能:分类,还有排序功能
定距测量尺度:例如:温度,0-10分——频数分布、平均值、标准差
功能:分类,排序,计算(加减功能等,不具备乘除),
没有绝对0点,当温度为0 ,还是有温度,0度的一半是什么呢??
定比尺度数据:例如:体重,身高,年收入——频数分布、平均值、标准差
功能:分类,排序,计算(加减比较)(乘除的比较),
有绝对0点,当体重为0 的时候,代表没有体重
定类+定序,合称为:分类变量
最主要频次统计
定距+定比,合称为:连续变量
最主要均值和标准差,频次统计