numpy教程
pandas教程
numpy和pandas常用库

numpy就是一个在python中做科学计算的基础库,也是大部分python科学计算库的基础库,它的强项是数值计算,多用于大型多维数组(比如列表、矩阵)上执行数值计算。

Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

1.numpy Ndarray对象

NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。
ndarray 对象是用于存放同类型元素的多维数组。
ndarray 中的每个元素在内存中都有相同存储大小的区域。

ndarray 内部由以下内容组成:
一个指向数据(内存或内存映射文件中的一块数据)的指针。
数据类型或 dtype,描述在数组中的固定大小值的格子。
一个表示数组形状(shape)的元组,表示各维度大小的元组。
一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要”跨过”的字节数。

  1. #创建一个ndarray
  2. numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

numpy和pandas - 图1

2. Pandas的数据类型

numpy和pandas - 图2