2-2-2-数据框(DataFrame) - 07 文件读取成DataFrame - 《Python 全栈开发与分析电子书(上)-V2022》

Pandas读取csv

读取某个CSV文件

import pandas as pd
df =pd.read_csv('aqi_statistic_analysis.csv')

实际上pd.read_csv 还有很多参数，可以在notebook中通过 ？pd.read_csv查询查询其参数

参数：

字符串，或者任何对象的read()方法。这个字符串可以是URL，有效的URL方案包括http、ftp、s3和文件。可以直接写入”文件名.csv”

将行号用作列名，且是数据的开头。注意当skip_blank_lines=True时，这个参数忽略注释行和空行。所以header=0表示第一行是数据而不是文件的第一行。

即指明原始文件数据没有列索引，这样read_csv为自动加上列索引，除非你给定列索引的名字。

表示文件第0行（即第一行，索引从0开始）为列索引，这样加names会替换原来的列索引。

布尔类型值 or int类型值的列表 or 列表的列表 or 字典（默认值为 FALSE）

int类型值，序列，FALSE（默认 None）将真实的某列当做index（列的数目，甚至列名）.

skiprows: list-like or integer or callable, default None 忽略某几行或者从开始算起的几行

skip_blank_lines 默认为True,跳过blank lines 而且不是定义为NAN
thousands 千分位符号，默认‘，’
decimal 小数点符号，默认‘.’
encoding: 编码方式