数据预处理:清洗、格式化、去重、排序、基础计算
数据的清洗:缺失值、离群值/异常值、重复值

定位重复数据

单列检测

选中列
image.png
选择功能,菜单栏”开始”
image.pngf
image.png
颜色被标记的为重复的值
image.png

删除重复数据

image.png
根据“哪些列”决定是否重复,然后删除
image.png