DataFrame.describe

DataFrame.describe(percentiles=None, include=None, exclude=None, datetime_is_numeric=False)
产生描述性统计。
对于数值数据,结果将包括:计数、平均值、标准值、最小值、最大值、25%、50%和75%;
对于对象数据,结果将包括:count、unique、top、freq和top

Parameters

percentiles 要包含在输出中的百分比。所有值都应该在0和1之间。默认为:0.25,0.5,0.75
include 要包含在结果中的数据类型列表
exclude 要从结果中省略的数据类型列表
datetime_is_numeric 是否将datetime dtypes视为数据

Example

  1. import pandas as pd
  2. df = pd.DataFrame({'site':['google', 'baidu', 'wiki', 'pandas'],
  3. 'age':[18, 39, 22, 45],
  4. 'price': [1.0, 2.0, 3.0, 4.0]})
  5. df.describe()
  6. -----------------------------------------------
  7. age price
  8. count 4.000000 4.000000
  9. mean 31.000000 2.500000
  10. std 13.038405 1.290994
  11. min 18.000000 1.000000
  12. 25% 21.000000 1.750000
  13. 50% 30.500000 2.500000
  14. 75% 40.500000 3.250000
  15. max 45.000000 4.000000

Example

  1. import pandas as pd
  2. df = pd.DataFrame({'site':['google', 'baidu', 'wiki', 'pandas'],
  3. 'age':[18, 39, 22, 45],
  4. 'price': [1.0, 2.0, 3.0, 4.0]})
  5. df.describe(include=[object])
  6. ------------------------------------
  7. site
  8. count 4
  9. unique 4
  10. top baidu
  11. freq 1