- 数据处理
- 建立在numpy的基础之上
- 支持更丰富的函数
-
读取
部分显示
支持部分显示头几行、尾几行
- 显示列名
-
索引
把当前所有列名做成一个list
- 定义一个空向量
- 在list中检索以(g)结尾的词,并添加在空向量中
- 索引表中以向量中的词为列名的列
-
数据类型
计算
插入新列
最大值
排序
泰坦尼克号案例
预处理缺失值
缺失值导入后显示为NaN
- 检索缺失值并求个数
- 如果不处理缺失值会影响计算
- 不让缺失值参与计算
- 但是也可以直接使用平均值函数
- 丢掉缺失值
分类平均
- 另一种求平均的方法(构建透视表)
- 实现离散化