01. 数据分析与Excel

1.1 数据分析的基本概念

  • 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取出有用的信息和形成结论而对数据加以研究和概括总结的过程。
  • 只要有数据产生的行业,就可以做数据分析。

image.png

1.2 选择Excel的原因

  • 数据分析常用的工具:Excel、SQL、SAS、SPSS、R、Python、Hadoop、Spark、Scala等。
  • 学数据分析要学Excel的最主要原因是市面上50%~60%的公司还在用Excel来做数据分析,市场占有率特别高。
  • 除此之外,数据分析选择Excel是因为Excel还具有以下特性:简单易学、灵活、运用广泛、强大、背后的公司强大(微软)。
  • Excel的学习内容:数据处理、函数、图表、透视表。
  • 学习方法:数据处理多练习;公式学习查帮助;若问图表怎么办,哪里不会点哪里;透视表一个字—“拖”。

    1.3 Excel的有趣应用

  • Excel做画:https://mp.weixin.qq.com/s?__biz=MjM5NzAyMDcyMA==&mid=401630376&idx=2&sn=e865ee13eee746b583d72de8bb61f8e5&scene=5&srcid=1120QzKEkUrCZmkip9XXIFZo#rd

  • 纽约曼哈顿的24小时人口活跃图: https://mp.weixin.qq.com/s/hXoPfMFNyIw0OWWliQnBAw?

    1.4 扩展资料

  • ExcelHome:https://www.excelhome.net/

  • 戴师兄Excel视频教程:https://www.bilibili.com/video/BV1ZM4y1u7uF/
  • 知乎入门学习文档:https://zhuanlan.zhihu.com/p/432736582?utm_medium=social&utm_oi=704475181925539840

    02. Excel的基本认识

    2.1 Excel的基本结构

  • Excel与MySQL类似,是一种用表格组织数据的形式。

  • Excel文件的层级组织结构:

    • 一个Excel文件被称为一个工作簿;
    • 一个工作簿中存在着多个工作表;
    • 工作表由行和列组织。
      • 行是1,2,3,4这样的形式出现的,最大行数为01. Excel简介 - 图2行;
      • 列是A,B,C,…XFD这种形式出现的,最大列数为01. Excel简介 - 图3列。
    • 一个行与一个列确定一个唯一的单元格。

      2.2 Excel文件类比SQL数据库

  • 一个工作簿类似于一个DataBase;

  • 一个工作表类似于DataBase中的一个Table;
  • 工作表中的列一般对应数据库表的一个字段,行则对应数据库表的一条记录。

    • 但是Excel也可以是一行为一个字段,一列为一条记录。
    • 因此,相对于SQL数据库而言,Excel的设计更为灵活。

      2.3 Excel工作簿扩展名

  • Excel文件的扩展名由于版本的不同会发生一些细微的变化。

  • MS Office 2003之前的版本中,Excel文件的扩展名为xls。
  • 从MS Office 2007及以上版本开始,Excel文件的扩展名由xlsx和xlsm两种。
  • 目前最常见的Excel文件扩展名为xlsx。
  • 需要注意的是:文件扩展名只影响文件之间的关联关系与文件的显示形式,对文件的内容本身不会产生什么影响。
    • 关联关系:如将一个xlsx的Excel文件改成.txt结尾的文件后缀,那么可能双击这个文件就会用记事本打开了,而Excel软件可能无法成功关联到这个文件。
    • 显示形式:如将一个.avi的视频文件改成.txt结尾的文件后缀,那么用记事本改开这个文件,显示的就不会是视频了。
    • 文件内容本身:不管文件的后缀变成了什么,文件中实际存储的数据都是不变的。如将一个.avi的视频文件改成.txt结尾的文件后缀,然后再用视频播放器打开这个.txt文件,播放出来的内容与修改前并没有什么差别。