1.相关库的安装
pip install pandaspip install xlrd ##2010以下版本的excel##2010以上的excel要用openpyxlpip install openpyxlpip install lxmlpip install xlsxwriterpip install html5libpip install BeautifulSoup4
2.Excel文件的读取
import pandas as pd
读取函数
pandas.read_excel(io="text.xls",sheet_name="sheet1")
关键是路径的表示
相对路径
python安全文件的路径
绝对路径
Linux/MAC/UNIX
'/usr/local/.......'
windows的路径参数
"x:\\文件夹1\\文件名........"'x:\\文件夹1\\文件名........'r'x:\文件夹1\文件名''http://yjsy.hfut.edu.cn/_upload/article/files/24/89/4eef4e1b43fd907761ba4ad23eac/97073206-40e5-419f-97b0-033adb86fbd4.xls'
```c import pandas as pd
df=pd.read_excel(r’d:\1.xlsx’,’Sheet1’)
绝对路径
df=pd.read_excel(“d:\1.xlsx”,”Sheet1”)
显示前五行
print(df.head())
显示全部
printf(df)
网络地址```cimport pandas as pddata=pd.read_excel('http://yjsy.hfut.edu.cn/_upload/article/files/24/89/4eef4e1b43fd907761ba4ad23eac/97073206-40e5-419f-97b0-033adb86fbd4.xls','Sheet1')print(data.head())
相关信息的处理
head()获取前五行数据info()index 整个行的索引信息columns 列的信息shape 表格的列和行
3.excel文件的写入
import pandas as pddata=pd.read_excel(r'd:\1.xlsx','Sheet1')print(data.shape)from pandas import ExcelWriterwriter=ExcelWriter(r'd:\2.xlsx',engine='xlsxwriter')data.to_excel(writer,sheet_name='Sheet1')writer.save()
- read_excel
- read_csv
- read_html
如果文件被破坏,读取会报错
