上个月我一个老哥私信我,说自己在公司干了8年数据清洗,现在AI一来,领导直接让他转岗,他坐在出租屋里刷招聘,投了30份简历全石沉大海。结果他用微软这个免费工具,半个月接了11单RAG数据准备的活,到手1.1万。
你以为AI只能用来聊天或者写文案?其实很多企业现在最缺的不是大模型,而是把乱七八糟的文件喂给AI的那一步。PDF排版乱、Word藏满样式、PPT全是图片没文字,AI根本看不懂。以前人工转Markdown要好几天,现在一行命令3秒搞定,客户直接拿去建知识库。
我自己也试过。以前帮客户做RAG项目,光数据清洗就得花一周,报价还被压。现在用这个工具,效率直接起飞。
第一步,去猪八戒网或者威客平台搜“RAG知识库”“PDF结构化”“文档转Markdown”这类关键词,筛单价200块以上的需求。别挑太大的,先从10-50页的小单练手。打开需求描述,看看客户要不要保留标题、表格、图片描述。
第二步,装工具。电脑打开命令行,敲一行:pip install markitdown[all]。装完直接用CLI命令:markitdown 客户文件.pdf > 输出.md。200页PDF我实测3秒,标题、列表、表格全保留得干干净净。如果是扫描件或者图片多的,加个可选OCR:装个openai客户端,把文件丢进去让GPT-4o帮描述图片。
第三步,交付前简单检查。打开生成的md文件,看看表格对齐没、链接还在不在。需要的话再用Claude或者通义千问微调一下格式。交付就给客户一个干净的md文件,或者打包成zip。备注里写清楚“支持二次修改两次,超出另算”。
第四步,报价和谈单。10-50页的小单我报280-480,50页以上按每页8块算。客户问你怎么这么快,就说“用微软官方开源工具,专门干这个的”。谈单时强调“转完直接喂AI,不用再人工校对,省你一周时间”。我半个月11单,平均一单400多,纯利润率90%以上。
第五步,升级接大单。把这个工具和LangChain或者AutoGen串起来,帮客户直接搭一个小型RAG知识库。报价直接上2000-5000一单。平台上搜“企业知识库建设”,需求越来越多。
你怕被AI替代,但真正赚AI钱的,是把AI用起来的人。
其实你不是不会用AI,你只是还没把数据清洗这步变成自己的现金流。
看到这里还没动的,和已经打开命令行试第一单的,是两种人。
#MarkItDown #AI接单 #RAG工具