如果已知数据的四分位数和中位数,我能不能用matplotlib直接绘制箱形图?

  统计/机器学习 数据预处理 描述性统计 数据可视化    浏览次数:2540        分享
0

箱形图是由四分位数和中位数决定的,如果这些数据已知,能不能直接在matplotlib把箱形图绘制出来?

现在matplotlib里的boxplot是需要输入整个原始数据的,而不能直接用四分位数和中位数。

 

jimmy   2020-04-21 09:08



   1个回答 
3

直接用plt.boxplot是不行的,可以用Axes.bxp

import matplotlib.pyplot as plt

fig, ax = plt.subplots()
boxes = [
    {
        'label':'Male height',
        'whislo': 162.6, #底部横线位置
        'q1': 170.2, #第一四分位数
        'med': 175.7, #中位数
        'q3': 180.4, #第三四分位数
        'whishi': 186.8, #顶部横线位置   
        'fliers': [160, 205] #outlier异常点的数值
    },
    {
        'label':'Female height',
        'whislo': 156.6, #底部横线位置
        'q1': 160.2, #第一四分位数
        'med': 163.7, #中位数
        'q3': 166.4, #第三四分位数
        'whishi': 171.8, #顶部横线位置   
        'fliers': [150, 151, 185] #outlier异常点的数值
    }
]
ax.bxp(boxes,showfliers=True)
ax.set_ylabel('cm')
plt.show()


SofaSofa数据科学社区DS面试题库 DS面经

tbh   2020-07-04 20:58



  相关讨论

Python里画直方图

标准化、归一化的区别是什么?

EDA步骤中,用全部数据还是只用训练集?

QQ-plot图里的x轴y轴是什么意思

boxplot里的横线是什么意思?

估计标准差的标准差?

统计里的IQR是什么意思?

Median Absolute Deviation的定义是什么?

标准误和标准差有什么区别?

为什么说中位数比平均数更稳健?

  随便看看

随机森林如何调参?

95%置信区间的正确理解

怎么计算(估计)ROC AUC的置信区间?

pandas.DataFrame里的loc和iloc什么区别?

【站务】我们回来了