我跟你说个真实的血压故事哈。
有段时间我每周一早上刚坐下,鼠标都还没点热,领导一个电话打过来: “东哥,上周的运营报表发我一下呗,就那个……用户数、下单量还有转化率那个。”
我心里一咯噔:又来了。 打开 7、8 个系统导出 CSV、Excel,复制粘贴、VLOOKUP 一顿猛操作,搞完已经快中午,关键还经常手一抖,把 F 列往右挪了一格,数据对不齐,被领导问数字为啥对不上,人都麻了。
就这种活,干一两次还行,每周干一次,人会精神状态异常的 you know?
后来有天晚上我实在受不了,就想:要不整个 Python 小脚本,让它自己干。反正机器不嫌烦,对吧。
结果一搞,还真就成了。现在每周一早上 8 点,机器人先帮我把报表算完,顺带发邮件,我 9 点慢悠悠进公司,装模作样刷新一下邮箱:“哎,报表已经出啦?”演得跟真的一样。
大概思路跟你唠一下,你照着改就能用。
先假装一个场景哈:
orders_2024-03-01.csv 之类我们要干的事:自动生成一个「按天 × 渠道」的汇总报表,存成 Excel,还带点简单的格式。
最粗暴版本,核心代码就几行,真的。
import pandas as pd
from pathlib import Path
defbuild_report(input_path: str, output_path: str):
# 读原始数据
df = pd.read_csv(input_path)
# 把下单时间转日期,比如 2024-03-01 12:33 -> 2024-03-01
df["date"] = pd.to_datetime(df["order_time"]).dt.date
# 简单清洗一下,过滤掉金额是空或者小于等于 0 的
df = df[df["amount"] > 0].copy()
# 核心:按 日期 + 渠道 做汇总
summary = (
df.groupby(["date", "channel"])
.agg(
order_cnt=("order_id", "nunique"),
user_cnt=("user_id", "nunique"),
gmvs=("amount", "sum")
)
.reset_index()
)
# 计算一个转化率随便玩玩
summary["avg_order_amount"] = (summary["gmvs"] / summary["order_cnt"]).round(2)
# 写到 Excel
summary.to_excel(output_path, index=False)
if __name__ == "__main__":
today_file = "data/orders_2024-03-01.csv"
report_file = "report/运营日报_2024-03-01.xlsx"
Path("report").mkdir(exist_ok=True)
build_report(today_file, report_file)
print("报表搞定:", report_file)
你看,其实核心逻辑就一个 groupby,以前你是手点“插入数据透视表”,现在变成让 Python 点。
上面这个只是“能用”,离“敢丢给领导”还有点距离,比如没有格式、没有千分位、小数点有点丑,对吧。
有一次我就这么直接给领导发原生表,结果领导默默回了句: “这个格式…看起来有点像测试数据?” 那一刻我意识到:不是领导不懂技术,是我不懂审美。
所以后面我加了一点点格式化,用 ExcelWriter + xlsxwriter,效果就顺眼多了。
import pandas as pd
from pathlib import Path
defbuild_pretty_report(input_path: str, output_path: str):
df = pd.read_csv(input_path)
df["date"] = pd.to_datetime(df["order_time"]).dt.date
df = df[df["amount"] > 0].copy()
summary = (
df.groupby(["date", "channel"])
.agg(
order_cnt=("order_id", "nunique"),
user_cnt=("user_id", "nunique"),
gmvs=("amount", "sum")
)
.reset_index()
)
summary["avg_order_amount"] = (summary["gmvs"] / summary["order_cnt"]).round(2)
# 开始写 Excel,并顺便美化一下
Path(output_path).parent.mkdir(exist_ok=True)
with pd.ExcelWriter(output_path, engine="xlsxwriter") as writer:
summary.to_excel(writer, sheet_name="日报", index=False)
workbook = writer.book
worksheet = writer.sheets["日报"]
# 来几个常用格式
money_fmt = workbook.add_format({"num_format": "#,##0.00"})
int_fmt = workbook.add_format({"num_format": "0"})
header_fmt = workbook.add_format({"bold": True, "bg_color": "#D9E1F2"})
# 表头加个背景色
worksheet.set_row(0, None, header_fmt)
# 按列设格式(假定列顺序固定)
worksheet.set_column("A:A", 12) # date
worksheet.set_column("B:B", 10) # channel
worksheet.set_column("C:D", 10, int_fmt) # order/user count
worksheet.set_column("E:E", 15, money_fmt) # gmvs
worksheet.set_column("F:F", 18, money_fmt) # avg_order_amount
写到这你应该发现了: 以前你点鼠标的那些步骤,什么“设置单元格格式、加粗、填充颜色”,其实都能用代码表达出来,只不过一开始会有点别扭。
但好处是——你配好一次,之后一辈子“复用”。不像 Excel 模板,天天有人乱改,一改就炸。
顺手再加一个“自动发邮件”,加完之后整个链路就闭环了:
邮件那块也不难,一个最小可用版本大概这样(示例用的是公司内网那种普通 SMTP,具体你得换成自家配置):
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.application import MIMEApplication
from email.mime.text import MIMEText
from pathlib import Path
defsend_report_mail(smtp_host, smtp_port, username, password,
to_list, subject, body, attach_path: str):
msg = MIMEMultipart()
msg["From"] = username
msg["To"] = ", ".join(to_list)
msg["Subject"] = subject
# 文本内容
msg.attach(MIMEText(body, "plain", "utf-8"))
# 附件
file_path = Path(attach_path)
with open(file_path, "rb") as f:
part = MIMEApplication(f.read())
part.add_header("Content-Disposition", "attachment", filename=file_path.name)
msg.attach(part)
# 发送
with smtplib.SMTP(smtp_host, smtp_port, timeout=10) as server:
server.login(username, password)
server.sendmail(username, to_list, msg.as_string())
主程序里简单串起来就行:
if __name__ == "__main__":
# 1. 先生成报表
input_path = "data/orders_2024-03-01.csv"
report_path = "report/运营日报_2024-03-01.xlsx"
build_pretty_report(input_path, report_path)
# 2. 再发邮件
send_report_mail(
smtp_host="smtp.xxx.com",
smtp_port=25,
username="report-bot@xxx.com",
password="your_password",
to_list=["boss@xxx.com", "op_team@xxx.com"],
subject="运营日报 - 2024-03-01",
body="各位,日报在附件里,数据有问题你们再艾特我哈。",
attach_path=report_path,
)
做到这一步,其实你已经拥有了一个“半成品 BI 系统”了,只不过界面是 Outlook 而已。
自动化这东西有个很有意思的点: 你一开始是想“偷懒”,但写着写着会发现,
我这边之前还被 SpringBoot 的默认配置坑过,数据库连数一高就炸,后来所有这种重复活能脚本的全给 Python 接管了,稳的一批。
至于“怎么自动定时跑”,简单说一句思路就行:
python report_job.py这样你哪怕人在家睡过头,报表照样乖乖躺在领导邮箱里。
反正核心就一句话: 能让机器干的事,就别折腾你自己。 报表这种又枯燥又容易出错的,交给 Python 是对双方的尊重。
行了,我就先说到这,剩下你照着你们公司数据结构改一改就能跑。 真遇到什么莫名其妙的报错,再来吐槽两句,我们一起骂它。