Python VS Excel - (十六)：合并数据 - 《数据分析》

(十六)：合并数据 - 图1

此系列文章收录在公众号中：数据大宇宙 > 数据处理 >E-pd

经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas

前言

本系列上一节说了拆分数据的案例，这次自然是说下怎么合并数据。

随着需求复杂度提高，很多时候已经不能用 excel 自带功能实现了，不过 pandas 中许多概念与 excel 不谋而合

案例1

公司的销售系统功能不全，导出数据时只能把各个部门独立一个 Excel 文件，此时你需要对整体数据做分析，最好的方式当然是先把各个文件统一汇总起来：

(十六)：合并数据 - 图2

这里有3个关键点：

这次我们需要用到3个包：

(十六)：合并数据 - 图3

我们来看看如何用 pandas 完成需求：

(十六)：合并数据 - 图4

关于 pathlib 的知识点，请关注公众号的入门必备系列文章

上面是普通的写法，这场景我倾向于使用推导式：

(十六)：合并数据 - 图5

推导式内容，请看数据大宇宙 > Python入门必备 > 必备知识 > 细讲Python推导式

案例2

有时候，表格中没有必要的信息，如下：

(十六)：合并数据 - 图6

(十六)：合并数据 - 图7

为什么上面不用推导式呢？因为推导式只适合一行连续调用的写法，当然这里还是可以使用推导式实现的：

(十六)：合并数据 - 图8

各种创建或移除行列数据的应用，请留意专栏文章

案例3

实际工作中还有更麻烦的情况，比如一个部门文件中又按性别划分了不同的工作表：

(十六)：合并数据 - 图9

其实，道理与案例2是一样的，只要知道怎么获取一个 Excel 文件的工作表名字，问题即可迎刃而解：

(十六)：合并数据 - 图10

总结

需要源码的小伙伴，公众号发送”数据处理”

如果希望从零开始学习 pandas ，那么可以看看我的 pandas 专栏。

扫描二维码

获取更多精彩

数据大宇宙

(十六)：合并数据 - 图11