import pandas as pd
- 读取csv文件:
pd.read_csv
- 显示前n条数据:
df.head()
- 查看当前数据df的基本信息:
df.info()
- df的索引信息:
df.index
- df的列信息:
df.columns
- df中每一列的数据类型:
df.dtypes
- df提前所有值信息:
df.values
- df的基本统计信息:
df.describe()
df的shape:
df.shape
DataFrame的创建 ```python
通过list来创建
array = [[1,2,3],[3,4,5]] df = pd.DataFrame(array)
通过字典来创建
dict = {‘name’:[‘datafrog’,’data’,’frog’],’age’:[18,19,18]} df = pd.DataFrame(dict)
- DataFrame和Series
DataFrame和Series都是pandas的基本数据结构。
- DataFrame:一个表格型的数据结构
- Series:一组有序的列
```python
s1 = pd.Series([1,2,3,4])
0 1
1 2
2 3
3 4
dtype: int64
s2 = pd.Series([2,3,4,5],index=['a','b','c','d'])
s2
a 2
b 3
c 4
d 5
dtype: int64
s3 = pd.Series({'a':1,'b':2})
a 1
b 2
dtype: int64