URL: http://ashipunov.me/shipunov/school/biol_240/en/

思考一个问题?

- 该数量的抽样人数,是否能比较好的预测整体?
- 进行抽样的人群,是否存在偏倚?
数据科学家可以做啥?
- 从大规模复杂的数据中确定其简单特征,中心趋势与变异;
- 找寻数据间的差异与原因;
- 找寻数据内部的潜在关系,如因果、相关等,甚至基于现有数据构建模型,对未知内容进行预测;
- 深入理解数据的结构,使用描述性与推断性方法窥视数据内部的类别。
不能做啥?

好用的包:
library(effsize)library(shipunov)
