目的,以实用为主。
描述中心趋势度量的,均值,中位数,总数相关的:
describe感觉比较实用,其它的都可以根据需要考虑一下使用。
import pandas as pdnum = pd.DataFrame(data={'age':[0,1,2,3,4,5,6,7,8,9,9,9,9,9,10,10,10],'balance':[100,200,300,400,500,600,700,800,900,1000,1000,1000,1000,1000,1100,1100,1100]})print(num.describe())'''均值'''print(num.mean())'''中位数'''print(num.median())'''众数'''print(num.mode())'''根据百分位来取值'''print(num.quantile(0.5))print(num.quantile(0.25))print(num.quantile(0.75))
描述变异性的度量,极差,方差,标准差相关:
import pandas as pdnum = pd.DataFrame(data={'age':[0,1,2,3,4,5,6,7,8,9,9,9,9,9,10,10,10],'balance':[100,200,300,400,500,600,700,800,900,1000,1000,1000,1000,1000,1100,1100,1100]})'''最大值'''print(num.max())'''最小值'''print(num.min())'''极差'''print(num.max()-num.min())'''方差'''print(num.var())'''协方差'''print(num.cov())'''这个标准差感觉比较奇怪,不清楚这里面使用的是什么方式计算的'''print(num.std)'''平均值的无偏标准差'''print(num.sem)
