学习目标

  • 目标
    • 了解什么是pandas
    • 了解Numpy与Pandas的不同
    • 知道使用pandas的优势

1 Pandas介绍pandas.png

  • 2008年WesMcKinney开发出的库
  • 专门用于数据挖掘的开源python库
  • 以Numpy为基础,借力Numpy模块在计算方面性能高的优势
  • 基于matplotlib,能够简便的画图
  • 独特的数据结构

    2 为什么使用Pandas

    Numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢?

  • 增强图表可读性

    • 回忆我们在numpy当中创建学生成绩表样式:

      1. array([[92, 55, 78, 50, 50],
      2. [71, 76, 50, 48, 96],
      3. [45, 84, 78, 51, 68],
      4. [81, 91, 56, 54, 76],
      5. [86, 66, 77, 67, 95],
      6. [46, 86, 56, 61, 99],
      7. [46, 95, 44, 46, 56],
      8. [80, 50, 45, 65, 57],
      9. [41, 93, 90, 41, 97],
      10. [65, 83, 57, 57, 40]])
    • 如果数据展示为这样,可读性就会更友好:score对比.png

  • 便捷的数据处理能力便捷的数据处理能力.png
  • 读取文件方便
  • 封装了Matplotlib、Numpy的画图和计算

    3 小结

  • pandas的优势【了解】

    • 增强图表可读性
    • 便捷的数据处理能力
    • 读取文件方便
    • 封装了Matplotlib、Numpy的画图和计算