数据分析在企业日常经营分析中有三大作用,即现状分析、原因分析、预测分析。数据分析是借助合适的工具去帮助公司发现数据背后隐藏的信息,对这些隐藏的信息进行挖掘,从而促进业务发展。围绕数据分析的整个流程,分别介绍每一个步骤中的操作,这些操作用Excel 如何实现,用Python又如何实现,主要包括:Python 环境配置、Python基础知识、数据源的获取、数据概览、数据预处理、数值操作、数据运算、时间序列、数据分组、数据透视表、结果文件导出、数据可视化等。
《对比Excel轻松学习Python数据分析》PDF原版,283页,有书签目录,文字可复制,张俊红著,配套数据集。
下载: https://pan.baidu.com/s/1L6Wa4SNNsMRnNNNx_029IQ
提取码: 8ba9
《Excel 数据之美科学图表与商业图表的绘制》PDF+《Excel数据处理与分析》PDF
《Excel 数据之美科学图表与商业图表的绘制》PDF,228页,有目录,全彩图,文字可复制,张杰著。《Excel数据处理与分析》PDF,244页,有目录,文字可复制,朱坤华著。
下载: https://pan.baidu.com/s/1ZHE3882ZoB27KfuEEbIxYg
提取码: fipv
柱形图是使用柱形高度表示第二个变量数值的图表,主要用于数值大小比较和时间序列数据的推移。x轴为第一个变量的文本格式,y轴为第二个变量的数值格式。柱形图系列还包括可以反映累加效果的堆积柱形图,反映比例的百分比堆积柱形图,反映多数据系列的三维柱形图等。条形图其实是柱形图的旋转图表,主要用于数值大小与比例的比较。对于第一个变量的文本名称较长时,通常会采用条形图。但是时序数据一般不会采用条形图。
《特征工程入门与实践》中文PDF+英文PDF+源代码+庄嘉盛
《特征工程入门与实践》中文PDF,222页,有书签目录,文字可以复制;英文epub;配套源代码。
作者: Sinan Ozdemir / Divya Susarla 译者:庄嘉盛
下载:https://pan.baidu.com/s/1GoDA-ZKAArB5lyRakCwpbg
提取码: ymhu
《Python数据可视化之matplotlib精进》PDF+源代码+刘大成
《Python数据可视化之matplotlib精进》PDF,259页,带目录,文字可复制;配套源代码
下载: https://pan.baidu.com/s/1Ftp1qZe2_IEzz2pxMGGxuw
提取码: g916
张亮《Python数据处理》PDF中英文+代码
《Python数据处理》中文PDF,402页,带目录,文字可复制;英文PDF,501页,带目录,文字可复制;配套源代码。
下载: https://pan.baidu.com/s/1AcDNYVCr-cakkyhmdmQUTA
提取码: qs8i
《Python数据处理》采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API中提取数据。
采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。在实际操作中掌握数据处理方法,比较实用。
学习数据分析,可选择《Python数据分析基础》,面向那些经常使用电子表格软件进行数据处理,但从未写过一行代码的人。前几章会教你设置Python运行环境,告诉你计算机是如何看待数据并对其进行简单处理的。你很快就能掌握在电子表格(包括CSV文件)和数据库中处理数据的方法。 刚开始,可能会觉得这样做是一种退步,如果你能熟练使用Excel,这种感受会更加强烈。
《Python数据分析基础》中文PDF+英文PDF+代码
《Python数据分析基础》高清中文PDF,278页,带目录和书签,能够复制;高清英文PDF,351页,带目录和书签,能够复制;中英文两版可以对比学习。配套源代码。
下载: https://pan.baidu.com/s/1kkMes2tlo_AAV4BbrFIl1w
提取码: 9daw
推荐学习《Python数据分析基础教程NumPy学习指南第2版》,通过书中丰富的示例,学会Matplotlib绘图,并结合使用其他Python科学计算库(如SciPy和Scikits),让工作更有成效,让代码更加简洁而高效。
《Python数据分析基础教程NumPy学习指南第2版》中文PDF+英文PDF+代码
《Python数据分析基础教程NumPy学习指南(第2版)》高清中文版PDF,249页,带目录和书签,文字能够复制;
高清英文版PDF,310页,带目录和书签,文字能够复制;配套源代码。
下载: https://pan.baidu.com/s/1va_nEixjFGAT_3dwvE9MHw
提取码: vri2
《Python数据分析实战》中文PDF+英文PDF+源代码
《Python数据分析实战》展示了如何利用Python 语言的强大功能,以最小的编程代价进行数据的提取、处理和分析。《Python数据分析实战》中文PDF,302页,带书签目录,文字可以复制。
《Python数据分析实战》英文PDF,350页,带书签目录,文字可以复制。
配套源代码。作者: 内利 译者: 杜春晓
下载: https://pan.baidu.com/s/1SI6Tx8jQVmOXYvJ01CrpKw
提取码: hp88
杜春晓《Python数据挖掘入门与实践》PDF中英文+源代码
下载: https://pan.baidu.com/s/1kboT3Mjvvgz852IDDPojLg
提取码: htkg
采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,也涉及神经网络、深度学习、大数据处理等内容。
学习推荐《从Excel到Python数据分析进阶指南》高清中文版PDF
《从Excel到Python数据分析进阶指南》高清中文版PDF,带目录,文字可以复制。
下载: https://pan.baidu.com/s/1suhTyWk2YKTScc6W-NO3Tg
提取码: jcpc
刘顺祥《从零开始学Python数据分析与挖掘》PDF+代码
《从零开始学Python数据分析与挖掘》PDF,476页,带目录,文字可复制,配套源代码。
下载: https://pan.baidu.com/s/18AsMrXppZ893R06jQCmNoQ
提取码: uckh
涉及Python的基础入门知识,数据分析案例(基于numpy模块,pandas模块的各种数据预处理的讲解;基于matplotlib模块,seaborn模块讲解常用统计图形的绘制过程),数据挖掘案例(基于sklearn模块,传递十种数据挖掘模型的理论讲解和应用实战,如回归模型,决策树模型,集成树模型,knn模型,贝叶斯模型等)。
唐亘《精通数据科学从线性回归到深度学习》PDF+源代码
《精通数据科学从线性回归到深度学习》PDF,432页,带书签目录,文字可以复制。配套源代码。
下载: https://pan.baidu.com/s/1ECrJwOVn2tQkWckhimvThw
提取码: kpv6
目前数据科学最前沿的两个领域分别是大数据和人工智能,主要讨论算法模型,也就是机器学习领域比较经典的模型,依次讨论了监督式学习、生成式模型以及非监督式学习。
工具书《利用Python进行数据分析第2版》PDF中文+英文PDF+代码
《利用Python进行数据分析第二版》中文pdf,667页,带目录,文字能复制;英文PDF,541页,带目录,文字能复制;配套源代码。
下载: https://pan.baidu.com/s/1GBWd0T2K_RyLuKdq5GepOQ
提取码: gc5p
特别有价值的内容集中在第四、五、八、十二章对NumPy,pandas,matpotlib等工具库的介绍中。对这些工具有着很深的理解,很好地阐述了这几个工具库的基本设计思路,而非简单地堆砌知识点。
Social Media Mining《社会媒体挖掘》中文PDF+英文PDF+课件+刘挺
《社会媒体挖掘》中文PDF,257页,带目录,文字可以复制。《社会媒体挖掘》英文PDF,338页,带目录,文字可以复制。
下载: https://pan.baidu.com/s/1mncD8w22rw-Q2ditLFa4Uw
提取码: gx8m
解决社会媒体数据的问题,涉及网络分析和数据挖掘的基本概念、新问题以及有效的算法。介绍一些基本概念以及适用于研究大规模社会媒体数据的主要算法,能够从大规模社会媒体数据中形式化地表示、衡量、建模和挖掘有意义的模式。
《Python数据科学手册》PDF中文+源代码
《Python数据科学手册》中文PDF,474页,带书签目录,文字可以复制。《Python数据科学手册》英文PDF,548页,带书签目录,文字可以复制。配套源代码。
下载: https://pan.baidu.com/s/1i7NnkQAj7yGISyF8_L0tcw
提取码: v3sw
以数据深度需求为中心的科学、研究以及针对计算和统计方法。很友好实用,结构很清晰。从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务。