1.相关库的安装

  1. pip install pandas
  2. pip install xlrd ##2010以下版本的excel
  3. ##2010以上的excel要用openpyxl
  4. pip install openpyxl
  5. pip install lxml
  6. pip install xlsxwriter
  7. pip install html5lib
  8. pip install BeautifulSoup4

2.Excel文件的读取

  1. import pandas as pd

读取函数

  1. pandas.read_excel(io="text.xls",sheet_name="sheet1")

关键是路径的表示

  • 相对路径

    python安全文件的路径

  • 绝对路径

    1. Linux/MAC/UNIX
    1. '/usr/local/.......'
    1. windows的路径参数
    1. "x:\\文件夹1\\文件名........"
    2. 'x:\\文件夹1\\文件名........'
    3. r'x:\文件夹1\文件名'
    4. 'http://yjsy.hfut.edu.cn/_upload/article/files/24/89/4eef4e1b43fd907761ba4ad23eac/97073206-40e5-419f-97b0-033adb86fbd4.xls'

    ```c import pandas as pd

df=pd.read_excel(r’d:\1.xlsx’,’Sheet1’)

绝对路径

df=pd.read_excel(“d:\1.xlsx”,”Sheet1”)

显示前五行

print(df.head())

显示全部

printf(df)

  1. 网络地址
  2. ```c
  3. import pandas as pd
  4. data=pd.read_excel('http://yjsy.hfut.edu.cn/_upload/article/files/24/89/4eef4e1b43fd907761ba4ad23eac/97073206-40e5-419f-97b0-033adb86fbd4.xls','Sheet1')
  5. print(data.head())

相关信息的处理

  1. head()获取前五行数据
  2. info()
  3. index 整个行的索引信息
  4. columns 列的信息
  5. shape 表格的列和行

3.excel文件的写入

  1. import pandas as pd
  2. data=pd.read_excel(r'd:\1.xlsx','Sheet1')
  3. print(data.shape)
  4. from pandas import ExcelWriter
  5. writer=ExcelWriter(r'd:\2.xlsx',engine='xlsxwriter')
  6. data.to_excel(writer,sheet_name='Sheet1')
  7. writer.save()
  • read_excel
  • read_csv
  • read_html

如果文件被破坏,读取会报错