

2. 点估计
点估计实现简单。但是容易受到随机抽样的影响,可能无法保证结论的准确性,但是点估计也并非一无是处,因为样本来自总体,样本还是能够体现出总体的一些特征的

3. 区间估计
置信区间、置信度(95%)

注意:就算你牛逼获得了总体的全部数据,但是总体也是不断发展的,你算出来的也只能算是过去发生的结果,对于总体来说,我们往往是没有办法获取总体的数据
3.1 中心极限定理


根据统计学中的中心极限定理,当样本数足够时(n>30),x拔的抽样分布可近似于正态分布。

3.2 正太分布的特性

检验代码


总结:所以我们 刚刚说的 两倍标准差包含95%的数据是一个估算值,具体应该是95.474%, 1.96倍的标准差才是包含95%,知道就好




4. 假设检验


4.1 小概率事件

就算你“接受了原假设”,也无法证明原假设就一定是对的,只是说你没有证据证明原假设是错误的而已
4.2 P-Value与显著性水平

4.3 假设检验的步骤

5. 常用假设检验
5.1 Z检验
基于总体标准差已知的情况



5.2 t检验

t 检验总体标准差未知, 所以使用样本的标准差 S 来代替总体的标准差进行计算

5.2.1 使用scipy进行t检验

import statsmodels.stats.weightstatsz检验就用statsmodels.stats.weightstats.ztest
