定义:箱线图是一种用作显示一组数据分散情况资料的统计图
组成:最小值、下四分位数(第25百分位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最 大值
作用:描述连续性变量的分布
箱线图能够显示出可能为离群点(范围±1.5*IQR以外的值,IQR表示四分位距,即上四 分位数与下四分位数 的差值)的观测

1.箱线图的生成

例:
boxplot(mtcars$mpg, main="Box plot", ylab="Miles per Gallon")
IMG_0101.jpg
注:原图作者对图形做了手工标注
boxplot.stats(mtcars$mpg)##此代码可输出用于构建图形的统计量

使用并列箱线图进行跨组比较

箱线图可以展示单个变量或分组变量
boxplot(formula, data=dataframe)
其中的formula是一个公式,dataframe代表提供数据的数据框(或列表)。一个示例公式为y ~ A,这将为类别型变量A的每个值并列地生成数值型变量y的箱线图。公式y ~ A*B则将为类别型 变量A和B所有水平的两两组合生成数值型变量y的箱线图。
例:
boxplot(mpg ~ cyl, data=mtcars, main="Car Mileage Data", xlab="Number of Cylinders", ylab="Miles Per Gallon")
IMG_0102.jpg
另外还可为多个分组因子绘制箱线图,待深入学习并了解因子后再补充。

代码及图片,部分文字理解均来自《R语言实战》