箱形图与小提琴图对比

请注意,尽管小提琴图与Tukey(1977)的箱形图密切相关,但它们还添加了有用的信息,例如样本数据的分布(密度轨迹)。

默认情况下,箱形图显示1.5 *四分位数范围之外的数据点作为晶须上方或下方的异常值,而小提琴图则显示数据的整个范围。

关于箱形图及其历史的一般参考可以在这里找到:http://vita.had.co.nz/papers/boxplots.pdf

小提琴图需要 matplotlib >= 1.4。

有关小提琴绘制的更多信息,scikit-learn文档有一个很棒的部分:http://scikit-learn.org/stable/modules/density.html

箱形图与小提琴图对比示例

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(9, 4))
  4. # Fixing random state for reproducibility
  5. np.random.seed(19680801)
  6. # generate some random test data
  7. all_data = [np.random.normal(0, std, 100) for std in range(6, 10)]
  8. # plot violin plot
  9. axes[0].violinplot(all_data,
  10. showmeans=False,
  11. showmedians=True)
  12. axes[0].set_title('Violin plot')
  13. # plot box plot
  14. axes[1].boxplot(all_data)
  15. axes[1].set_title('Box plot')
  16. # adding horizontal grid lines
  17. for ax in axes:
  18. ax.yaxis.grid(True)
  19. ax.set_xticks([y + 1 for y in range(len(all_data))])
  20. ax.set_xlabel('Four separate samples')
  21. ax.set_ylabel('Observed values')
  22. # add x-tick labels
  23. plt.setp(axes, xticks=[y + 1 for y in range(len(all_data))],
  24. xticklabels=['x1', 'x2', 'x3', 'x4'])
  25. plt.show()

下载这个示例