工作中常被Excel卡顿、重复操作折磨?今天分享3个我私藏的Python数据处理模板,覆盖清洗、统计、可视化,复制到你的环境就能用,无需额外下载。
Python环境即开即用式安装,花五分钟搞定,详见
案例一:一键清洗杂乱数据
空值、重复行手工处理易出错,用Pandas几行搞定。
import pandas as pddf = pd.read_csv('销售数据.csv')df.drop_duplicates(inplace=True) # 删除重复行df['销售额'].fillna(df['销售额'].median(), inplace=True) # 数值列填中位数df['产品类别'].fillna('未知', inplace=True) # 类别列填“未知”print(f"清洗完毕,当前数据量:{len(df)} 行")
替换文件名即可复用,让Python替你处理脏数据。
案例二:分组统计,秒出报表
需要按类别汇总销售额、订单数?groupby 一句生成汇总表,并直接导出Excel。
summary = df.groupby('产品类别').agg(总销售额=('销售额', 'sum'),平均单价=('单价', 'mean'),订单数=('订单ID', 'count')).reset_index()summary.to_excel('分类汇总报表.xlsx', index=False)print("报表已生成!")
扩展按月份、地区等分组同样方便,告别数据透视表的手动拖拽。
案例三:自动出图,趋势一目了然
用Matplotlib快速生成带标注的趋势图,用于汇报与展示。
import matplotlib.pyplot as pltdf['日期'] = pd.to_datetime(df['日期'])monthly = df.resample('M', on='日期')['销售额'].sum()plt.figure(figsize=(10,5))plt.plot(monthly.index, monthly.values, marker='o', color='#2E86AB')plt.title('月度销售趋势', fontsize=16)plt.xlabel('月份'); plt.ylabel('销售额(元)')plt.xticks(rotation=45)plt.tight_layout()plt.savefig('销售趋势图.png', dpi=150)plt.show()
图表自动保存本地,让数字自己“说话”。
使用建议
以上代码均为完整片段,你只需准备自己的数据文件,根据离线压缩包安装Python环境指南 安装好环境即可,新手建议在Jupyter中逐段执行,便于观察中间结果。
数据处理没有捷径,但好模板能让你事半功倍。如果这些代码对你有帮助,欢迎转发给更多朋友,一起早点下班。有运行问题直接在文章下留言,我会逐一解答。
核心代码通过以下方式获取:
关注本公众号,点击”服务“,然后点击底部的”实战代码“,即可获取下载链接。
如果想系统性学习Python处理数据,不再零散拼凑技巧,欢迎预约我的直播间。每周日下午,我会用真实业务场景带你从入门到进阶,涵盖表格自动化、数据清洗、可视化等模块。全程实战教学,现场答疑,帮你真正把Python变成职场利器。点击预约,我们周日见!
请在微信客户端打开