数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。代替了以前那种拍脑袋、靠经验做决策的做法,因此越来越多的企业重视数据分析。具体来说,数据分析在企业日常经营分析中有三大作用,即现状分析、原因分析、预测分析。数据分析是借助合适的工具去帮助公司发现数据背后隐藏的信息,对这些隐藏的信息进行挖掘,从而促进业务发展。
《对比Excel轻松学习Python数据分析》PDF原版+数据测试集
《对比Excel轻松学习Python数据分析》PDF原版,283页,有书签目录,文字可复制,张俊红著,配套数据集。
下载: https://pan.baidu.com/s/1L6Wa4SNNsMRnNNNx_029IQ
提取码: 8ba9
数据分析是指利用合适的工具在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。
围绕数据分析的整个流程,分别介绍每一个步骤中的操作,这些操作用Excel 如何实现,用Python又如何实现,主要包括:Python 环境配置、Python基础知识、数据源的获取、数据概览、数据预处理、数值操作、数据运算、时间序列、数据分组、数据透视表、结果文件导出、数据可视化等。
总体概览指标又称统计绝对数,是反映某一数据指标的整体规模大小,总量多少的指标。例如,当日销售额为60 万元,当日订单量为2 万,购买人数是1.5 万人,这些都是概览指标,用来反映某个时间段内某项业务的某些指标的绝对量。我们把经常关注的总体概览指标称为关键性指标,这些指标的数值将会直接决定公司的盈利情况。对比性指标是说明现象之间数量对比关系的指标,常见的就是同比、环比、差这几个指标。同比是指相邻时间段内某一共同时间点上指标的对比,环比就是相邻时间段内指标的对比;差就是两个时间段内的指标直接做差,差的绝对值就是两个时间段内指标的变化量。
我们学习excel、Excel目的都是能够完成数据分析的任务,《对比Excel轻松学习Python数据分析》围绕整个数据分析的常规流程:熟悉工具—明确目的—获取数据—熟悉数据—处理数据—分析数据—得出结论—验证结论—展示结论进行Excel和Python的对比实现,告诉每一个过程中都会用到什么,过程与过程之间有什么联系。
通过对比Excel功能操作去学习Python的代码实现,而不是直接学习Python代码,大大降低了学习门槛。
从数据采集、清洗、抽取,以及数据可视化等多个角度介绍了日常工作中数据分析的标准路径。通过对比Excel与Python在数据处理过程中的操作步骤,详细说明了Excel与Python间的差异,以及用Python进行数据分析的方法。
对于重复数据、测试数据我们一般都是做删除处理的。对于缺失数据,如果缺失比例高于30%,那么我们会选择放弃这个指标,即做删除处理。而对于缺失比例低于30%的指标,我们一般进行填充处理,即使用0、均值或者众数等进行填充。对于异常数据,需要结合具体业务进行处理,如果你是一个电商平台的数据分析师,你要找出平台上的刷单商户,那么异常值就是你要重点研究的对象了;假如你要对比Excel,分析用户的年龄,那么一些大于100 或者是小于0 的数据,就要删除。