单聚合函数无法满足多指标统计,同分组下同时执行求和、均值、极值、去重计数,一站式产出多维业务指标。场景:按销售区域、商品品类分组,分别对金额、销量、用户数执行差异化聚合计算。核心知识点:字典形式指定字段+聚合函数组合、多函数命名、聚合结果重命名、多层分组指标提取。① 生成测试数据
import pandas as pdimport numpy as npdf = pd.DataFrame({ "region": np.random.choice(["华东","华北","华南","西南"], 180), "category": np.random.choice(["数码","家居","美妆"], 180), "order_amt": np.random.randint(80, 4500, 180), "sale_qty": np.random.randint(1, 20, 180), "uid": np.random.randint(1000, 1100, 180)})df.to_excel("multi_agg_data.xlsx", index=False)print("多函数聚合测试数据生成完成")
② 核心代码
import pandas as pddf = pd.read_excel("multi_agg_data.xlsx")# 多字段+多聚合函数组合计算agg_rule = { "order_amt": ["sum", "mean", "max"], "sale_qty": ["sum", "min"], "uid": "nunique"}# 分组聚合 + 层级重命名agg_df = df.groupby(["region", "category"]).agg(agg_rule)agg_df.columns = ["总营收", "平均客单价", "单笔最高金额", "总销量", "最小单量", "下单用户数"]agg_df = agg_df.reset_index()print("多维指标统计结果:")print(agg_df.head(8))
结果展示
总结
多函数并行聚合是复杂报表的高效写法,无需多次分组遍历,一次计算产出全维度指标,大幅精简代码、提升运行效率,是数据分析报表自动化的常用方案。