1、箱型图,是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三蚵播噍疸四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
2、箱型图无需对数据进行正态分布要求。适用范围广。(判断异常的其他方法比如3西伽马,z分数方法都要求数据服从正态分布。)
3、识别箱型图数据异常值,如下图所示。
4、箱型图SPSS操作步骤:分析→描述统计→探索。
5、绘制图形→茎叶图 不分组 → 选择图形等,如下所示,见标红部分。
6、分析结果如下图所示:异常值显示为对应日期。此样本数据而且服从正态分布。
7、箱型图的局限:1.不能提供关于数据分布偏态和尾重程度的精确度量;2.对于批量比较大的数据批,反应的形状信息更加模糊;3.用中位数代表总体评价水平有一定的局限性;