Day 05 Excel能分析数据,为什么还要学习Python?
image.png

拉勾教育-阿信老师(阿信老师):
🌈同学们,今天班会马上就要开始啦~~

👉【主题】Excel能分析数据,为什么还要学习Python?
👉【形式】文字/图片

👉【时间】晚上8点

👉【地点】本学习交流群

准时参加的同学回复:
数据分析升级
@所有人

拉勾教育-阿信老师(阿信老师):

👉 Excel数据分析

拉勾教育-阿信老师(阿信老师):
如果是一般的数据分析工作人员,只需要粗通数据分析,没有百万级以上的数据处理需求,我个人优先推荐excel而不是Python。

拉勾教育-阿信老师(阿信老师):
首先excel的好处是图形化界面容易上手,然后excel在管理业务表格的时候,excel三大件(函数,数透,VBA)组合起来已经解决了很多数据分析的需求。

拉勾教育-阿信老师(阿信老师):
image.png
拉勾教育-阿信老师(阿信老师):
函数库相当丰富,函数和数组函数相结合,基本上就相当于很多个小的python包了,能解决很多字符处理、数学统计运算、逻辑判断等功能。函数的组合使用也有很多技巧。

拉勾教育-阿信老师(阿信老师):
👉比如,数据的快速分组

拉勾教育-阿信老师(阿信老师):
传统用法中,如果要对数据进行分组,用Python写非常复杂的函数,效率非常的低,但是使用Excel中透视表就非常的便捷

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
👉再比如,之作高级交互表

拉勾教育-阿信老师(阿信老师):
传统的图表要想制作出交互功能,只有通过插入组件,或者使用数据验证制作下拉菜单进行交互。

拉勾教育-阿信老师(阿信老师):
而利用数据透视表,可以便捷的插入切片器、动态透视图、日程等等,制作出非常强大的交互效果。

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
如果使用Python进行代码编写就变得非常的复杂,甚至我们还不能编写出比较实用的代码。

拉勾教育-阿信老师(阿信老师):

👉 Excel的缺点

拉勾教育-阿信老师(阿信老师):

✔ 跨平台性低

拉勾教育-阿信老师(阿信老师):
Excel只能运行在Windows和Mac平台,这个可以说是Excel最大的劣势点了。

拉勾教育-阿信老师(阿信老师):
而数据库可以运行在任意平台,企业中使用Linux系统的不在少数。所以,Excel的这一劣势点被无限放大。

拉勾教育-阿信老师(阿信老师):

✔ 能处理的数据量小

拉勾教育-阿信老师(阿信老师):
经常使用Excel的朋友应该都发现过这个问题,当Excel的数据量过大的时候,其查询和计算速度会有明显的下降,甚至不能正常运行,这对于工作来说实在是不可接受的

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
因此,就需要使用数据库产品,因为数据库产品的存储更大,可以让我们存储更多的数据信息。

拉勾教育-阿信老师(阿信老师):

👉 Python数据分析

拉勾教育-阿信老师(阿信老师):
下面,我们客观来说下Python数据分析吧。

拉勾教育-阿信老师(阿信老师):

✔ 简单易学

拉勾教育-阿信老师(阿信老师):
Python最大的优点那就是简单易学。很多学过Java的朋友都知道,Python语法简单的多,代码十分容易被读写,最适合刚刚入门的朋友去学习。

拉勾教育-阿信老师(阿信老师):
比如一个Hello World,Python只需要一句print(“Hello World”)。

拉勾教育-阿信老师(阿信老师):
而比较复杂的Java需要声明一个HelloWorld对象,需要下面几行代码才能打印一个Hello World。

拉勾教育-阿信老师(阿信老师):

  1. public class HelloWorld {
  2. public static void main(String[] args) {
  3. System.out.println("Hello World");
  4. }
  5. }

拉勾教育-阿信老师(阿信老师):
即使你没学过编程,也能够看懂Python代码,因为Python代码和英语阅读很类似。

拉勾教育-阿信老师(阿信老师):

✔ 办公自动化

拉勾教育-阿信老师(阿信老师):
有一句古话:工欲善其事,必先利其器。

拉勾教育-阿信老师(阿信老师):
这时不妨学会借助Python这个小工具,提升效率。帮我们快速完成自动抓取资料、提取关键词、分析数据、自动下载等工作。

拉勾教育-阿信老师(阿信老师):
这就如同在别人还在吭哧吭哧爬楼梯的时候,你已经坐上了直梯,当然更爽了!
不仅能保住一头飘逸的秀发,还能有更多时间拥有自己的生活!

拉勾教育-阿信老师(阿信老师):
用python批量读写CSV文件

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
我们只需要写一个脚本就可以批量读写excel文件,如果下次遇到其他相同场景的,我们也可以使用Python脚本进处理。

拉勾教育-阿信老师(阿信老师):
在不改变数据源的情况下,代码输出结果一致,不会随着时间和人员的变化而出现不同的分析结果,可复现性和可使用性强。

拉勾教育-阿信老师(阿信老师):

✔ 制作数据报表

拉勾教育-阿信老师(阿信老师):
我们数据分析工作人员,经常遇到制作数据报表问题。如果我们遇到多次完全一样需求的数据报表,采用Excel进行制作,显得十分低效。

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
如果使用Python编成代码,并封装函数,然后我们直接调用,只需要修改路径,同样可以达到数据报表的需求,这样显得更加高效。

拉勾教育-阿信老师(阿信老师):

✔ 丰富的第3方库

拉勾教育-阿信老师(阿信老师):
对于Python有很多数据分析的第三方库库,如Numpy,Pandas,Matplotlib,Seaborn,Scipy,StatModels, Pyecharts,Bokeh,Blaze,Plotly,NetWorkX,Biopython,SymPy和gwpy等。

拉勾教育-阿信老师(阿信老师):
它们为Python数据分析,相对于excel提供了更加高级的工具和做法。

拉勾教育-阿信老师(阿信老师):
👉 制作全国主要城市空气质量分布图

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
用Excel来处理,显然是一个不能完成的任务,这时候我们应该调用采用Python数据分析相关的第三方库。如果数据源有更改,我们也不用重新制作,因为代码具有可复用性。

拉勾教育-阿信老师(阿信老师):

👉 机器模型的建立和分析

拉勾教育-阿信老师(阿信老师):
现在很多公司的数据工作已经不是简单的report了,而是需要分析,甚至建模分析。
这方面,python 的优势是巨大的。

拉勾教育-阿信老师(阿信老师):
使用Python作数据分析的重要原因之一在与机器学习,Python拥有丰富且强大的机器学习、深度学习库。

拉勾教育-阿信老师(阿信老师):
image.png

拉勾教育-阿信老师(阿信老师):
在Python中机器学习最出名的第三方库莫过于sklearn,我们通过sklearn建立回归,分类,无监督等机器模型,而且学起来非常的容易上手。

拉勾教育-阿信老师(阿信老师):
这个机器学习在Excel中是一个不存在的概念。

拉勾教育-阿信老师(阿信老师):

👉 Excel 和 Python

拉勾教育-阿信老师(阿信老师):
其实Excel和Python在近两年一直在被做对比,有的小伙伴现在并不需要学习,但是并不代表以后用不上,技多不压身,excel的vba其实也是很强大,学的深的话基本可以解决大部分数据处理问题!

拉勾教育-阿信老师(阿信老师):
简单来说,excel能做到的Python都能做到,但是excel不是一个强大的编程语言,不能进行丰富逻辑处理,复杂的运算分析。

拉勾教育-阿信老师(阿信老师):
当然,不管是Excel还是Python都只是工具,我们更需要加强逻辑思维和业务分析能力,找到自己的核心竞争力,工具只是辅助和帮助你表达的东西。

拉勾教育-阿信老师(阿信老师):
———第五天了,抓紧学习——-

拉勾教育-阿信老师(阿信老师):
😱下面到了咱们今天测评解析的环节了~~

拉勾教育-阿信老师(阿信老师):
1、以下说法正确的是:(ACD)

拉勾教育-阿信老师(阿信老师):
A:指标体系是一套能从各维度去反映业务状况的框架。

B、指标体系无需其他部门人员协助,只需要由分析师制定就行

C、指标体系要能从各维度反映业务的核心状况

D、指标体系需要具有可落地、可实施性

拉勾教育-阿信老师(阿信老师):
解析:B选项为什么错呢,指标体系不是分析师闭门造车造出来的,一定是需要多方参与的,大家一起商量出来的

拉勾教育-阿信老师(阿信老师):
2、指标的选取包括下面哪些原则:(ABC)

拉勾教育-阿信老师(阿信老师):
A、根本性

B、可理解性

C、结构性

D、可观察性

拉勾教育-阿信老师(阿信老师):
解析:指标体系的三个原则:

根本性:对于核心数据一定要理解到位和准确

可理解性:所有指标要配上业务解释性,如日活的定义是什么,是登录APP算一个日活还是有消费金额算一个日活呢

结构性:结构性要求指标体系能够充分对业务进行解读,如新增用户只是一个大数,我们还需要知道每个渠道的新增用户、每个渠道的新增转化率、每个渠道的新增用户价值等。

拉勾教育-阿信老师(阿信老师):
3、指标体系建立有哪几步?(ABCD)

A、厘清业务发展阶段和方向

B、确定核心指标

C、指标核心维度拆解

D、指标宣贯、存档、落地

拉勾教育-阿信老师(阿信老师):
解析:这四步是标准的指标体系制定的步骤,需要先了解业务的现阶段状态,然后找到核心指标,然后进行维度拆解,最后还需要落地执行

拉勾教育-阿信老师(阿信老师):
4、流量分析分为哪几部分?(ABCD)

A、渠道分析

B、转化分析

C、价值分析

D、波动分析

拉勾教育-阿信老师(阿信老师):
解析:四个选项都是流量分析的组成部分:

渠道分析——流量从哪来;

转化分析——流量从来到转化经过了什么过程;

价值分析——流量产生了多少价值;

波动分析——流量日常的监控分析。

拉勾教育-阿信老师(阿信老师):
5、以下说法不正确的是?(ABC)

A、渠道分类一般分为内部渠道和外部渠道

B、我们可以用象限分析法评估渠道质量

C、评估渠道的关键指标包括有效用户数、留存、ROI

D、ROI<1的渠道必须要立即砍掉

拉勾教育-阿信老师(阿信老师):
解析:D选项的错误在于说的太过绝对,有的时候即使ROI小于1也不是要立即、必须砍掉,需要判断一下ROI为什么小于1,有没有机会吧ROI做上去等等。

拉勾教育-阿信老师(阿信老师):
6、下列关于功能模块的价值分析,哪些选项是正确的?(ABC)

A、某功能核心用户数越多,该功能越有价值

B、A/B测试能说明功能对大盘的贡献度

C、需要关注该功能对收入贡献

D、某功能改进版上线后,使用这个功能的用户数激增,我们可以得出这次功能改进是成功的

拉勾教育-阿信老师(阿信老师):
解析:D选项的问题在于我们除了要看用户数涨没涨,我们还需要观察一下核心用户数的变化情况,核心用户才是我们的根基。

拉勾教育-阿信老师(阿信老师):
7、关于竞品分析,下面哪些说法是正确的?(BCD)

拉勾教育-阿信老师(阿信老师):
A、假设你所在的公司处于行业中游,行业所有头部玩家都是你的竞品

B、做竞品分析时,首先要确定分析目的

C、确定分析目的后,需要挑选 1~2 家竞品,进行对比分析

D、完成竞品的对比分析后即可得出初步的分析结论

拉勾教育-阿信老师(阿信老师):
解析:选项A:做竞品分析切忌把行业其他公司都当做“假想敌”。做竞品分析首先需要明确你的分析目的,目的不一样,你选取的竞品公司可能也不一样。与所有数据分析一样,先想清楚分析的目的,然后再根据分析目的,选取参照物——竞品公司。