这是 Marvis 实战系列的第 9 篇文章。
前 8 天我们聊的都是「零代码」操作。今天破个例,讲点带代码的事。放心,你不需要会写代码,甚至不需要懂语法。我要分享的是:怎么让 Marvis 替你写 Python 脚本,处理那些 Excel 里反复折腾的数据。
我为什么开始用 Marvis 写脚本
上个月做季度质量报告,我从 8 个测试系统导出了 47 份 CSV 文件。每个文件格式还不一样:有的用逗号分隔,有的用分号;有的日期列叫"测试日期",有的叫"Date";有的把合格/不合格写成"OK/NG",有的写成"1/0"。
以前这种活我的做法很原始:打开 Excel,复制粘贴,VLOOKUP 拉公式,手动改格式。47 份文件,我搞了整整 6 个小时。中间还弄错两回,重新来过。
那天我试了一下让 Marvis 写个 Python 脚本。它花了 3 分钟生成代码,我花了 2 分钟复制粘贴运行。47 份文件,30 秒处理完毕,格式统一,数据干净,直接生成汇总表。
省下的 6 小时不是重点。重点是以后再遇到类似的批量数据处理,我只需要改两个参数,跑一遍就行。
Marvis 写代码,和你想的完全不一样
你不需要懂 Python。甚至不需要知道 Python 是什么。
我的做法很简单:用大白话描述你要干什么,Marvis 负责翻译成代码。
比如我对 Marvis 说:
我有一个文件夹里有 40 多个 CSV 文件,每个文件都有"零件编号""测试值""测试结果"三列,但列名不完全一样。我想把所有文件合并成一个 Excel,并且在末尾加一列统计每个零件编号出现的次数。
Marvis 返回了一段完整的 Python 脚本,带中文注释,告诉我每一步在干什么。我复制到电脑上运行,搞定。
它还能干三件事:
写代码:你描述需求,它生成可运行的脚本。 解释代码:给了你一个脚本看不懂?粘贴进去,它逐行解释这段在干什么。 改代码:运行报错了?把报错信息贴给 Marvis,它告诉你哪里错了、怎么改。
这三板斧下来,代码小白也能完成 80% 的数据处理任务。
3 个我亲测有效的实战场景
下面这三个案例都是我在汽车零部件研发里真实遇到的。你可以直接复制我的描述去用。
场景一:批量合并测试数据
我的问题:每周从实验室下载 20-30 份测试报告,都是 Excel,格式相同但分散在不同文件。需要合并成一张总表,按零件编号排序,统计每批数据的平均值和标准差。
我给 Marvis 的描述:
写一个 Python 脚本,功能如下:1. 读取指定文件夹里所有 .xlsx 文件2. 每个文件都有表头,表头名称是"零件编号""测试值1""测试值2""测试日期"3. 把所有文件的数据纵向合并成一张大表4. 按"零件编号"分组,计算每组的"测试值1"和"测试值2"的平均值、标准差、最大值、最小值5. 把结果输出为一个新的 Excel 文件,文件名叫"汇总报告_YYYYMMDD.xlsx"6. 要求:如果某个文件缺少某列,跳过该文件并在控制台打印警告
Marvis 生成的脚本用了 pandas,大概 30 行。我运行了 3 次:第一次少装了一个库,Marvis 告诉我用 pip install openpyxl;第二次有个文件是空的,脚本报了警告但没中断;第三次完美跑完。整个合并加统计,20 秒。
以前手动做,至少 1 小时。
场景二:从混乱文本里提取结构化数据
我的问题:供应商发来的报告经常是 PDF 或者图片,里面嵌着表格。我需要把里面的尺寸公差数据提取出来,放到我们的质量管理系统里。
我给 Marvis 的描述:
我有一个 PDF 文件,里面有多页表格。表格内容包含"测量项""标称值""实测值""公差上限""公差下限""判定结果"。请写一个 Python 脚本:1. 读取 PDF,提取所有表格2. 把表格数据整理成结构化格式(CSV 或 Excel)3. 对于"判定结果"列,只保留"合格"或"不合格"两种值,其他文字统一标记为"需人工复核"4. 输出文件保存到桌面
Marvis 用了 pdfplumber 库来读表格。实际跑下来,提取准确率大概 85%。有个别扫描版 PDF 文字识别有问题,Marvis 在脚本里加了 try-except,出错的那几行单独标红,不影响整体。
85% 的自动化 + 15% 的人工复核,比 100% 手工输入快太多了。
场景三:自动生成可视化图表
我的问题:每月要给管理层汇报零部件测试合格率趋势。数据源是质量系统导出的 CSV,每次都要手动做透视表、画折线图、调格式。
我给 Marvis 的描述:
我有一个 CSV 文件,包含以下列:日期、零件类型、批次号、测试数量、合格数量。请写一个 Python 脚本:1. 读取 CSV,计算每个零件类型每月的合格率(合格数量/测试数量)2. 画一张折线图,X轴是月份,Y轴是合格率,每条线代表一个零件类型3. 在图上标注平均值线,低于 95% 的数据点标红4. 图片保存为 PNG,分辨率 300dpi5. 同时输出一个 Excel,包含原始数据和计算后的合格率
跑出来的图可以直接贴进 PPT。合格率低于 95% 的红点一清二楚,管理层一眼就能看到问题月份。以前这个图我要在 Excel 里调 20 分钟,现在 5 秒生成,而且下个月换一批数据,改个文件名重新跑就行。
效率对比
这些数字不是我编的宣传口径。是我在过去两个月里,用计时器一一测出来的。
新手容易踩的 4 个坑
坑 1:描述需求时太笼统
「帮我处理一下这些数据」——这种描述 Marvis 根本不知道你要什么。
正确做法:说清楚输入是什么、输出要什么、中间要做什么判断。最好给一个具体例子。比如「输入是 CSV,有三列叫 A/B/C,输出要计算 C 列的平均值并按 B 列分组」。
坑 2:第一次运行报错就放弃
脚本第一次跑通的成功率大概 60%。常见原因:缺依赖库、文件路径写死、编码问题。这类报错大多由环境差异引起,改起来通常只花一两分钟。
我的做法是:把报错信息原样复制给 Marvis,它 90% 的情况下能直接给修复方案。不用自己查 Stack Overflow。
坑 3:让脚本做太复杂的判断
Marvis 写的脚本适合处理规则明确、步骤固定的任务。如果中间需要大量人工经验判断(比如「这个异常数据要不要剔除,看工程师心情」),脚本就不合适了。这种环节应该让脚本输出"待复核清单",人工最后把关。
坑 4:不保存脚本
很多人跑完一次就把脚本扔了。下次遇到类似任务,又重新描述一遍需求。
我的习惯是:每个脚本保存下来,文件名写清楚功能。下次类似需求,把旧脚本扔给 Marvis,说"在这个基础上改,现在需要加一列 X 的计算"。比从头描述快一倍。
今天就可以用的 Prompt 模板
复制下面这个框架,填上你自己的需求:
请帮我写一个 Python 脚本,用于处理以下任务:【输入数据】- 文件类型:(如 CSV / Excel / PDF / 图片)- 文件位置:(如"C:\\Users\\Name\\Desktop\\data")- 数据结构描述:(列名、格式、示例数据)【处理要求】1. (具体步骤 1)2. (具体步骤 2)3. (具体步骤 3)【输出要求】- 输出格式:(Excel / CSV / 图表 / 文本)- 保存位置:(具体路径)- 其他要求:(如"低于某值标红""空值跳过并打印警告")【注意事项】- (如"某些文件可能缺少某列""日期格式不统一")
用这个模板描述需求,Marvis 生成的脚本准确率能提高一倍。核心原则就一条:你说得越具体,它写得越对。
写在最后
我不是程序员。12 年汽车零部件研发,我的武器一直是 Excel、PPT 和测试设备。两个月前我对 Python 的唯一认知是「听说做 AI 的人都在用」。
现在我的电脑上存着 17 个 Marvis 写的 Python 脚本,每周帮我省出 3-4 小时。这些脚本没有一个是我写的,但每一个都在按照我的思路干活。
这就是今天想分享的核心:Marvis 充当翻译,把你的自然语言转成机器能懂的代码,代码再替你干活。你站在中间,动动嘴皮子就行。
下一篇 Day 10,我会讲怎么用 Marvis 做内容创作,从选题到成稿,AI 全程辅助。
你在用 Marvis 过程中遇到什么问题?评论区聊聊,说不定下一篇就写你的问题。
Eric | 12 年汽车零部件研发从业者 × AI 实践者