数据分析aka统计分析包括统计描述和统计推断
    1.描述统计(statistical description)
    用统计指标aka统计量(statistic)和统计表与统计图对数据的数量特征及其分布规律进行测定和描述.
    2. 统计推断(statistical inference)
    指如何在一定的置信(也称可信)程度下由样本信息推断总体特征。包括如何由样本统计指标(统计量)来推断总体相应指标(参数,parameter),称为参数估计( estimation of parameter),以及如何由样本差异来推断总体之间是否可能存在差异,称为假设检验(hypothesis test)。
    总体
    根据研究目的而确定的同质观察单位的全体称为总体(population),更确切地说,它是同质的
    所有观察单位某种观察值的集合。
    有限总体
    无限总体
    根据样本信息来推断总体特征的方法,即抽样研究(sampling research)的方法来实现,这种从总体中抽取部分观察单位的过程称为抽样(sampling)。为保证样本的代表性,抽样时必须遵循随机化(randomization)原则。从总体中随机抽得的部分观察单位,其实测值的集合,就称为样本,该样本中所包含的观察单位数称为该样本的样本含量(sample size)
    变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的
    变异性,称为变量(variable)。
    变量值:对变量的观测值称为变量值(value of variable)或观察值(observed value),由变量值构成数据。例如,以人为观察单位调查某地 2018 年 7 岁正常儿童的生长发育状况,性别、身高、体重等都可视为变量。性别有男有女,身高可高可矮,体重可轻可重,不同个体不尽相同,这种个体间的差异称为变异(variation)。这些变异来源于一些已知或未知,甚至是某些不可控制的因素所导致的随机误差。

    离散变量&连续变量:变量分为连续型和离散型两种,如果在数轴上任意不同两点之间可取值是有限的,则称为离散变量(discrete variable),如数轴上任意不同两点之间可取值是无限的,则称为连续变量(continuous variable)。变量的观察结果可以是多种形式。

    按变量是定量或定性,可将数据分为以下几种类型:

    1.计量资料
    . 7
    计量资料(measurement data)又称定量资料(quantitative data)或数值变量(numerical
    variable )资料,是指观测每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值
    大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型(continuous)或离散型
    (discrete)两类。前者可在实数范围内任意取值,如身高、体重、血压等;后者只取整数值,如单位容积
    (L)的红细胞计数、白细胞计数。
    计量资料还包括货币(如家庭年收人)、时间(如小鼠染毒后的存活天数)、比值(如体重指数)和百
    分比(如白细胞分类)。
    2.计数资料
    计数资料(enumeration data)又称定性资料(qualitative data)或无序分类变量
    (unordered categorical variable)资料,亦称名义变量(nominal variable)资料,是指将观察单位按某种属性
    或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属
    性或类别,如试验结果的阳性阴性、家族史的有无等。分两种情形:
    (1)二分类:如检查某小学学生牙齿中龋齿的情况,以每个学生为观察单位,结果可报告为龋齿阴
    性与阳性两类;如观察某药治疗某病患者的疗效,以每个患者为观察单位,结果可归纳为治愈与未愈两
    类。两类间相互对立,互不相容。