你一定遇到过这种 Excel 场景:文件夹里几十个表,有的是日报,有的是导出表,列名不统一、日期格式乱、还有一堆空行。
你不是不会处理,你只是不想 一个个点、一个个改。
这一课,我们不教你怎么写 pandas。我们只做一件事:👉 教你用 DeepSeek,写一个“点一下就能合并 Excel”的自动化脚本。
1️⃣ 先说清楚:这一课我们要干什么
今天这个脚本,目标非常明确:
输入:一个文件夹,里面全是 .xlsx
输出:一个 output.xlsx 总表
中间做的事:
📌 你只负责:告诉 DeepSeek 规则是什么📌 它负责:把这些规则写成能跑的代码
2️⃣ 第一件关键的事:别急着要代码,先要“结构”
很多人一上来就对 DeepSeek 说:
“帮我写个 Excel 合并脚本”
然后它甩给你一大坨代码,看不懂,也不敢改。
正确顺序是:先要方案,再要代码。
你可以这样跟 DeepSeek 说(直接复制)👇
我要写一个 Excel 自动化脚本,请你先不要写代码。需求:- 批量读取文件夹里的 xlsx- 清洗数据(空行、空列、字符串去空格、日期统一)- 统一列名(支持 mapping)- 合并成一个总表并导出- 有处理日志,单个文件失败不影响其他文件请你只输出:1)整体处理流程(3-6 步)2)建议的模块拆分3)常见坑(给新手看的)
📌 你会发现:当 DeepSeek 先把流程说清楚,后面的代码几乎不会跑偏。

3️⃣ 第二步:让 DeepSeek 写“完整脚本”,但你不用一次看懂
方案确认后,再让它写代码。
这一步你要明确告诉它:这是一个“工程脚本”,不是演示代码。
你可以这样问👇
请根据你刚才的方案,写一个可直接运行的 Python 脚本(单文件),实现 Excel 自动化处理。功能要求:- 扫描输入文件夹下所有 .xlsx- 读取指定 sheet(参数 --sheet,可选);如果不存在就读第一个 sheet- 清洗:删除全空行;字符串去首尾空格;日期列尽量转成 yyyy-mm-dd- 统一列名:支持一个 mapping(参数 --mapping 指向 JSON 文件);若不提供则用内置默认 mapping- 合并所有表,导出为 output.xlsx(参数 --output)- 打印处理日志:每个文件读取/清洗后行数;被跳过的文件原因;最终合并行数- 异常处理:单文件失败不影响其他文件工程要求:- Python 3.10+- 使用 pandas + openpyxl- 必须有 main(),用 argparse 解析参数- 给我 3 个运行示例命令- 最后再给“常见报错排查清单”(比如缺依赖、sheet 不存在、编码问题等)
📌 这一刻你要有一个心理预期:代码一定会很长,这是正常的。(这里我就不继续截图了)
4️⃣ 长代码不可怕,可怕的是“不会让 AI 改”
你不需要一次性看懂全部代码。你只需要记住一个用法:
每次只改一个需求,让 DeepSeek 帮你改。
比如你可以继续这样问:
“加一个自定义列名映射 JSON”
“支持 .xls 文件”
“合并后按 date 排序”
“日志同时输出到文件和控制台”
推荐你用这个“只改不重写”的追问方式👇
基于你刚才生成的脚本,请不要重写整体结构,只在原代码基础上实现这个新需求:{你的需求}请说明改动点,并只给我需要修改的代码片段。
5️⃣ 这一课你真正学到的,不是 Excel,是方法
如果你回头看,会发现这一课没教你 pandas API。但你已经学会了三件更重要的事:
1.复杂需求,先让 AI 说结构2.长代码,不追求一次看懂3.用“需求 + 迭代”驱动代码进化
这套方法,不只适用于 Excel,写爬虫、写脚本、写自动化,都一样。
🔜 下期预告
下一课我准备继续往下走:
评论区告诉我:👉 你最想让 Excel 自动化解决的,是哪一步?
下一课,我们继续让 AI 干活,你只负责点运行。