URL: http://ashipunov.me/shipunov/school/biol_240/en/
思考一个问题?
- 该数量的抽样人数,是否能比较好的预测整体?
- 进行抽样的人群,是否存在偏倚?
数据科学家可以做啥?
- 从大规模复杂的数据中确定其简单特征,中心趋势与变异;
- 找寻数据间的差异与原因;
- 找寻数据内部的潜在关系,如因果、相关等,甚至基于现有数据构建模型,对未知内容进行预测;
- 深入理解数据的结构,使用描述性与推断性方法窥视数据内部的类别。
不能做啥?
好用的包:
library(effsize)
library(shipunov)