数据可视化 | vis.zone数据可视化

<返回 箱线图

箱线图 Boxplot


箱线图

箱线图

箱线图

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因图形如箱子,且在上下四分位数之外常有线条像胡须延伸出去而得名。

离群值会有时会画成是个别的点。箱型图是无母数的,他显示样品的特性,对于母体分布并无任何假设。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。

箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。

统计分析

数据分析的过程中常用的图形,看懂此类图一般需要懂一点 统计学/概率论 的基础知识。
统计分析的可视化一般是在分析的过程中当做 分析工具,或在学术领域内交流使用。
统计分析图形很少直接面向普通用户,通常普通用户只去看分析后的最终结论,所以一般更注重 精确性,不太注重交互效果

统计学图形系列:直方图 | 箱线图 | 散点图 | 小提琴图 | 散点气泡图 | 悬根图 | 聚类分析 | 冰柱图 | 三维散点图

定义

  1. Q0/4:最小值(minimum)
  2. Q1/4:第1四分位数(lower quartile)
  3. Q2/4:中位数(第2四分位数、median)
  4. Q3/4:第3四分位数(upper quartile)
  5. Q4/4:最大值(maximum)
  6. 以第1四分位数(Q1/4)和第3四分位数(Q3/4)的数值作为箱型的上下限。
  7. 当有数值与第1与第3四分位数的范围差距1.5×IQR以上时,该值为离群值(outlier)。
  8. 数值位于范围外1.5×IQR到3×IQR范围的数值,称作适度离群值(mild outlier)。
  9. 数值位于范围外3×IQR以上的数值,称作极端离群值(extreme outlier)。

箱线图

图形类型 箱线图


用户 :
类型 :
输入 :
数据输入 : x

工具代码 箱线图


相关样例 箱线图