扣子编程(https://code.coze.cn/)刚刚做了一个大版本升级,支持最近特别火的Skills(技能)。Skill是一种软件打包的方式,结合AI大模型,通过定制流程和使用工具完成用户需求。本来Skill是需要人工开发的,现在只要通过自然语言描述需求,AI就能自动创建。
Skill的运行是依赖开发工具,比如Claude Code或者Open Code,对于普通用户来说安装起来比较麻烦,还要解决各种配置问题,用起来不太方便。扣子编程提供了在线支持,开发和运行都在扣子编程完成,用户只关心输入输出,再也不用操心工具的安装使用了。
为了更好的说明,我在扣子编程上添加了一个新的Skill,用于支持PDF文档转成Word文档。整个过程只需以下三步:
最好的免费工具市场就是github,这个上面有大量的各式各样的工具,基本上想到的和想不到的工具都有。第一步问deepseek“github中星最多的PDF转Word的工具”,AI说是PaddleOCR (https://github.com/PaddlePaddle/PaddleOCR),这个项目的Star接近70K,一个非常高的数值了,说明很多人都在使用,质量相当不错。

打开扣子编程网页,使用手机号登录,然后选中技能,在对话框中输入:把这个工具 https://github.com/PaddlePaddle/PaddleOCR 打包成一个skill,用它来转换PDF文档到Word文档。然后AI会自主抓取这个工具,分析工具的说明书,尝试安装和使用这个工具,并在远端的虚拟机上运行和测试,直到运行成功。整个过程全自动进行,无需进行额外干预。

Skill生成以后,在预览窗口进行功能验证,如果功能符合预期,再点击右上角的部署选项。

部署成功以后,这个技能才可以在扣子(https://www.coze.cn/)的主对话框中通过@进行调用,这样使用起来方便很多。

到这一步的时候,Skill已经生成并能在线运行了,但是效果如何呢?我选择了DeepSeek V3.2的技术报告,这个PDF文档包含大量的公式、表格、图片等信息,使用这个Skill在线转换生成对应的word文档,下载到本地用word打开进行对比。


以上是word文档截图,表格和图片转换的效果已经非常接近原版了,而且表格和图片上的所有文字都能编辑,但是公式效果差一些,整体来说还是相当不错的。这个技能的链接地址 https://code.coze.cn/p/7599171665888722990,大家也试试看呢。
总结
今天的例子以具体工具为例,免费又好用的工具主要集中在GitHub上,这些工具普遍的特点是安装配置麻烦,对环境要求比较多,非专业人士基本不用。扣子编程的Skill出现,按照上面的三步,普通用户也能用了,确实是很大的进步。
Skill不只是可以调用工具,也可以访问知识库,这里是扣子编程上的知识库。不过有一点,扣子编程运行Skill的时候,如果需要交互式登录个人账号的话,它是无法完成浏览器认证流程,也就是它不能依赖需要账号的服务。
不只是Skill,扣子编程的主页还支持通过自然语言描述需求的方式,AI自动生成智能体、工作流、网页应用和手机应用,基本不需要手工开发。大家可以专心关注业务需求和业务流程,具体实现交给AI负责。
最后还有一点,扣子编程是在线运行的,如果资料比较敏感,无法在线处理的话,开源社区也提供了本地运行的方案 opencode + oh-my-opencode,支持本地部署并提供兼容 API 的大模型服务,实现完全离线的 AI 编程辅助。如果大家有兴趣的话,我会再准备一期,分享如何搭建本地环境,使用国内大模型服务,自动生成和运行各种Skills。