当前位置：首页>python>Python绘制高颜值豆荚图

Python绘制高颜值豆荚图

2026-07-04 13:58:02

代码绘制成果展示

这张豆荚图直观地展示了三个组别在两种条件下的数据分布与统计对比结果。整体来看，所有组别在Night条件下的均值均高于Day条件，其中City的均值由1.11升至1.21，Land由1.02升至1.17，Grass由0.99升至1.05；图中的背景小提琴图和散点描绘了数据的具体分布形态，内部的白色线段和圆点标示了四分位距和均值，而黑色的散点则标识出了各组存在的离群点/异常值。根据图表顶部的显著性检验标注可知，City和Land的左右两种条件之间存在显著差异，而Grass的左右条件之间差异则不具备统计学意义。

多种配色

代码解释

第一部分

库的导入以及字体设置

# =========================================================================================# ====================================== 1. 环境设置 =======================================# =========================================================================================import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns

第二部分

颜色库的设置以及配色方案的选择

# =========================================================================================# ======================================2.颜色库=======================================# =========================================================================================COLOR_SCHEMES = {    1: {"violin": {"Day": "#F9C4C4", "Night": "#BCE0F4"}, "scatter": {"Day": "#E87C7C", "Night": "#6AB5DE"}},}scheme_id = 25  #使用的配色方案theme = COLOR_SCHEMES.get(scheme_id, COLOR_SCHEMES[1])  # 获取配色方案palette_violin = theme["violin"]  #小提琴图颜色palette_scatter = theme["scatter"]  #散点图颜色

第三部分

绘图函数：创建画布与绘制基础小提琴图

# =========================================================================================# ======================================4.绘图函数=======================================# =========================================================================================def plot_bean_chart():    # 创建画布    fig, ax = plt.subplots(figsize=(8, 6), dpi=150)    #绘制小提琴图    sns.violinplot(        data=df,  #数据        x="Group",  #x轴        y="Value",  #y轴        linewidth=0,  #边框宽度        alpha=0.7,  #透明度        ax=ax  #坐标轴    )

第四部分

绘图函数：散点图部分

    #绘制散点图    sns.stripplot(        data=df[~df['Is_Outlier']],  #正常值数据        x="Group",  #x轴        alpha=1,  #明度        size=6,  #大小        jitter=0.15,  #水平方向的随机抖动        zorder=1, #层        linewidth=1  #轮廓线宽    )

第五部分

绘图函数：绘制统计线和标注

    # 遍历每个唯一的分组    for i, groupinenumerate(df['Group'].unique()):        #获取当前分组下Left条件的所有统计量        left_stats = stats_df[(stats_df['Group'] == group) & (stats_df['Condition'] == 'Day')].iloc[0]        #均值、Q1、Q3        mean_l, q1_l, q3_l = left_stats['mean'], left_stats['q1'], left_stats['q3']        #获取当前分组下Right条件的所有统计量        right_stats = stats_df[(stats_df['Group'] == group) & (stats_df['Condition'] == 'Night')].iloc[0]        #绘制代表左侧均值的数据点        ax.plot(x_left,  #x                mean_l,  #y                marker='o',  #形状                color='white',  #颜色                markersize=6,  #大小                zorder=4)  #层        #左侧均值文本标注        ax.text(x_left - 0.06,  #x                mean_l,  #y                f'{mean_l:.2f}',  #文本                ha='right',  #水平                va='center',  #垂直                fontsize=11,  # 大小                fontweight='bold',  #加粗                color='black',  #颜色                zorder=5)  #层

第六部分

绘图函数：执行 T 检验与显著性标注

        left_data = df[(df['Group'] == group) & (df['Condition'] == 'Day')]['Value']  #获取当前组别条件的所有具体数值数据        right_data = df[(df['Group'] == group) & (df['Condition'] == 'Night')]['Value']  # 取当前组别条件的所有具体数值数据        #绘制显著性标记        ax.text(i,  #x                y_pos,  #y                sig_label,  #文本                ha='center',  #水平                va='bottom',  #垂直                fontsize=14,  #大小                fontweight='bold',  #加粗                color='black')  #颜色

第七部分

绘图函数：图框、标题、刻度设置，图例添加，绘图结果保存

    #标题    ax.set_title("Group Comparison Bean Chart",  #文本                 fontsize=16,  #大小                 fontweight='bold',  #加粗                 pad=15)  #间距    #获取图例中所有的文本对象进行属性修改    plt.setp(legend.get_texts(),fontweight='bold',fontsize=11)    y_global_min = df['Value'].min()  #全局最小值    y_global_max = df['Value'].max()  #全局最大值    ax.set_ylim(y_global_min - 0.2, y_global_max + 0.25)  #Y轴范围    ax.set_ylabel('')  #去掉y轴标题    ax.set_xlabel('')  #去掉x轴标题    #设置边框线    for spine in ax.spines.values():        spine.set_linewidth(2.0)  #粗细        spine.set_color('black')  #颜色    #配置刻度线属性    ax.tick_params(axis='both',  #X轴和Y轴                   which='major',  #主刻度线                   direction='out',  #朝外                   length=4,  #长                   width=2.0,  #粗细                   labelsize=11)  #字体大小

第八部分

执行部分，负责数据的读取、预处理及绘图

# =========================================================================================# ======================================2.颜色库=======================================# =========================================================================================if __name__ == '__main__':    data_path = r'data.xlsx'  #原始数据路径    df = pd.read_excel(data_path)  #读取数据    df['Is_Outlier'] = False  #新建一列用于存储异常值    # 遍历不同组别    for group in df['Group'].unique():            lower = q1 - 1.5 * iqr  #下边界            upper = q3 + 1.5 * iqr  #上边界            # 基于先前的分类掩码，进一步把数值小于下界或大于上界的异常值提取出新的布尔掩码            outlier_mask = mask & ( (df['Value'] < lower) | (df['Value'] > upper))            # 通过DataFrame的loc方法，把新掩码标记为异常值的数据对应所在行的'Is_Outlier'列赋值为True            df.loc[outlier_mask, 'Is_Outlier'] = True   #绘图    plot_bean_chart()

如何应用到你自己的数据

1.设置配色方案：

scheme_id = 25  #使用的配色方案

2.设置绘图结果的保存地址：

plt.savefig(fr'_chart{scheme_id}.png', dpi=300,bbox_inches='tight')

3.设置原始数据的文件路径：

data_path = r'data.xlsx'  #原始数据路径

Python绘制高颜值豆荚图

最新文章

热门文章

随机文章

Python绘制高颜值豆荚图

AI化学系列——Notebook1:Python入门

Python-05基础语法-运算符(体系文章)

最新文章

热门文章

随机文章