首先导入数据
Students.xlsx

1.如何查看数据框(DataFrame)的索引、数据类型及内存信息

  1. data.info() # 查看数据框的索引、数据类型及内存信息
  2. """
  3. <class 'pandas.core.frame.DataFrame'>
  4. RangeIndex: 20 entries, 0 to 19
  5. Data columns (total 4 columns):
  6. ID 20 non-null int64
  7. Name 20 non-null object
  8. Age 20 non-null int64
  9. Score 20 non-null int64
  10. dtypes: int64(3), object(1)
  11. memory usage: 600.0+ bytes
  12. """
  13. # 从中我们可以得到很多信息,例如数据框一共有16个条目,4个数据列,及每列的数据类型;涉及到的数据类型;内存信息

2.查看数据框的内容

  1. 查看数据框的行数与列数
  1. print(data.shape)
  2. """
  3. (20, 4)表示数据框一共有20行,4列
  4. """
  1. 查看数据框的前n行

  1. print(data.head()) # 查看数据框的前n行 默认前五行
  2. """
  3. ID Name Age Score
  4. 0 1 Student_001 16 87
  5. 1 2 Student_002 26 92
  6. 2 3 Student_003 33 100
  7. 3 4 Student_004 27 73
  8. 4 5 Student_005 32 63
  9. """

  1. 查看数据框的后n行
  1. print(data.tail()) # 查看数据框的后n行 默认后五行
  2. """
  3. ID Name Age Score
  4. 15 16 Student_016 30 96
  5. 16 17 Student_017 16 77
  6. 17 18 Student_018 35 87
  7. 18 19 Student_019 19 86
  8. 19 20 Student_020 20 94
  9. """

  1. 如何查看中间的的数据
  1. # data.iloc[a:b, c:d] # 选取第a到b行,c至d列的数据
  2. print(data.iloc[:, :2]) # 选取全部行,0到2列的数据

3.如果当读取的Excel表有空行 空列时,该如何正确读取数据?

Books.xlsx

  1. import pandas as pd
  2. books = pd.read_excel('tmp\Books.xlsx', skiprows=3, usecols='C:F')
  3. print(books)
  4. """
  5. ID Name InStore Date
  6. 0 NaN Book_001 NaN NaN
  7. 1 NaN Book_002 NaN NaN
  8. 2 NaN Book_003 NaN NaN
  9. 3 NaN Book_004 NaN NaN
  10. 4 NaN Book_005 NaN NaN
  11. 5 NaN Book_006 NaN NaN
  12. 6 NaN Book_007 NaN NaN
  13. 7 NaN Book_008 NaN NaN
  14. 8 NaN Book_009 NaN NaN
  15. 9 NaN Book_010 NaN NaN
  16. 10 NaN Book_011 NaN NaN
  17. 11 NaN Book_012 NaN NaN
  18. 12 NaN Book_013 NaN NaN
  19. 13 NaN Book_014 NaN NaN
  20. 14 NaN Book_015 NaN NaN
  21. 15 NaN Book_016 NaN NaN
  22. 16 NaN Book_017 NaN NaN
  23. 17 NaN Book_018 NaN NaN
  24. 18 NaN Book_019 NaN NaN
  25. 19 NaN Book_020 NaN NaN
  26. """