在前面几篇中,我们系统梳理了 AI Agent 的核心组成:从整体架构、开发框架(如 LangChain/LangGraph)、工具调用机制(Function Calling 到 MCP 协议),再到记忆系统(Memory)。
但这些内容都建立在一个隐含前提之上
开发者需要具备一定的编程能力。
这就像在教人开车之前,先要求他学会制造发动机🤔。
然而现实是,随着大模型能力的普及,越来越多的非技术人员——如产品经理、运营、HR、业务分析师也希望快速验证和部署智能体应用。他们并不关心 ReAct 循环如何实现,而是更关注:“能否在快速上线一个能自动回答员工关于年假、报销政策的 Bot?”
于是,低代码(Low-Code)乃至无代码(No-Code)AI Agent 开发平台应运而生。
赋能非技术人员:让不懂 Python 的业务专家也能成为智能体的创造者。
让用户更聚焦于业务逻辑:将使用者从繁琐的构建开发中解放出来,专注于Agent创意。
加速 Agent DevOps 闭环:实现从“灵光一现”到“上线验证”的快速跃迁。
本篇文章将聚焦这一趋势,剖析低代码平台如何封装 Agent 的核心能力,并以字节的 Coze、开源的Dify、被Meta收购的Manus 为例,对比其设计理念、功能差异与适用场景。
在 Web 1.0 时代,建一个网站需要精通 HTML、CSS,甚至要自己架设服务器。后来 WordPress、Wix 这样的 CMS 和建站工具出现了,一夜之间,全世界的小商家、个人博主都能拥有自己的数字门面。
AI Agent 正在经历同样的历程。当 GPT-4、Claude 3、Qwen-Max 等模型的能力趋于稳定,智能本身已不再是稀缺资源。真正的瓶颈变成了“如何高效地将智能封装为可用的产品”。
低代码平台所做的,不是搞出什么新发明,而是把前面几篇讲过的那些技术模块——工具调用、记忆系统、工作流引擎、RAG 管道——全部打包、封装、产品化。你不再需要一行行地写代码去注册一个工具,而是只需要在一个界面上点选“天气”插件,然后配置好你的 API Key 就行了。你也不用自己去研究 FAISS 或 Milvus,上传一个 PDF,平台就自动为你构建好了一个知识库问答系统。
回望过去两年,我们见证了无数惊艳的 Agent Demo。它们在技术圈子里被疯狂转发,但最终大多都沉寂在 GitHub 的某个角落,成了「一次性烟花🎆」。
低代码平台的核心价值,恰恰就在于补齐了这些短板。它们内置了权限控制、审计日志、多环境部署、企业级 SSO 登录等能力。这让一个由 HR 自己搭建的“政策问答 Bot”,也能拥有媲美专业软件的安全性和稳定性。
可以说,低代码平台的出现就是为了「Agent 走出技术象牙塔」的最后一公里。
有意思的是,到了 2026 年初,这个“点点鼠标”的方式本身也发生了改变。
最近 Coze 2.0 和 MiniMax Agent 2.0 都大版本更新了,改成了Agentic对话模式的交互。
现在你打开这些平台,可以直接用自然语言描述,比如:“帮我做个智能体,能自动读飞书会议记录,生成摘要,然后发给参会人。” 系统会跟你来回聊几句,确认细节(比如摘要要多长、什么时候发、要不要过滤某些内容),然后在后台自动生成对应的技能、工作流,甚至整个智能体。
这说明什么?Manus 的路子被大家看懂了,也开始被抄作业了。
原来大家都觉得「可视化=低门槛」,现在发现,toC的门槛还是不够低,对于许多完全没有技术背景的用户而言,理解“工作流”、“节点”、“条件分支”等概念本身依然存在认知负担。与此同时,经过2-3年的发展,普通老百姓使用大模型的心智也已经被驯化好了,人们已经习惯于直接告诉AI自己想要什么。
所以,上手构建应用的最低门槛,也从“可视化点击”到“自然语言对话”。
普通人需要做到的,就只剩「把想法说清楚,剩下的交给 AI 」,才是真正的“低代码”——甚至于接近“无代码”。
那么,抛开交互范式的差异不谈,让我们来看看,一个成熟的 AI Agent 低代码平台,其内核都离不开哪些核心能力的封装:
| |
| 支持多轮对话的状态管理、上下文感知、意图识别(Intent Recognition)和槽位填充(Slot Filling)。高级平台还支持对话策略优化,例如在信息不足时主动追问(Proactive Questioning)。 |
| 提供丰富的预置插件(如搜索、计算、翻译、企业 IM 通知),并支持用户通过 OpenAPI 规范或自定义函数(Function)注册私有工具。主流前沿平台已全面拥抱 MCP (Model Context Protocol) + Skills,实现工具的标准化发现与调用。 |
| 支持上传多种格式文档(PDF, PPT, DOCX, TXT),自动构建 RAG(检索增强生成)系统。支持对接主流向量数据库(如 Milvus, Weaviate, Pinecone),并提供分块策略、嵌入模型选择等高级配置。 |
| 提供短期会话记忆(Session Memory)以维持上下文连贯性,并开始探索长期用户记忆(User Memory)系统,用于存储和利用跨会话的个性化信息。 |
| 提供可视化画布,允许用户通过拖拽节点(LLM 节点、条件判断、API 调用、代码执行、知识库检索等)来构建复杂的、非线性的决策逻辑。这是区分简单 Bot 和复杂 Agent 的关键。 |
| 不再局限于文本交互。集成图像识别(OCR)、语音输入/输出(TTS/ASR)、文生图(Text-to-Image)、甚至视频生成(Text-to-Video)能力,极大地丰富了 Agent 的感知与表达维度。 |
部署与分发 (Deployment & Distribution) | 一键发布到 Web、H5、小程序(微信/抖音)、企业 IM(飞书/钉钉/企微)、Discord、Slack 等数十个渠道。提供 Webhook、RESTful API 等标准接口,便于集成到现有业务流中。 |
低代码平台的魔力,正在于它将这些原本分散、复杂、需要深厚专业知识才能驾驭的能力,整合成了一个流畅、直观、开箱即用的产品体验。它成功地将构建一个功能性 Agent 的成本,从“一个工程师一周”降低到了“一个业务人员一小时”,从而真正开启了“人人都是智能体工程师”的时代。
理论终归是枯燥的,让我们把目光投向现实世界,看看三位最具代表性的玩家,是如何在这片蓝海中各自划桨的。
官网:https://www.coze.cn/home
Coze (中文名“扣子”)是字节跳动于 2023 年底推出的 AI 应用开发平台,主打“开箱即用、无缝集成”,也是国内最早进行商业化尝试的在线闭源低代码 Agent 开发工具之一。
📈 发展历程与产品演变
参考的更新日志:https://www.coze.cn/open/docs/guides/release_note
早期的扣子以极简体验为核心,用户仅需通过自然语言描述即可快速创建AI Bot,功能聚焦于问答、插件调用(如搜索、翻译)等简单任务。目标用户是普通创作者和运营人员,强调“零代码、三分钟上线”。
随着用户需求的深化,简单的自动化模式遇到了瓶颈,同时存量的Agent应用模版也显得过于简单,导致开发者大量流失。为了留住开发者,扣子了推出可视化工作流画布,允许开发者通过图形化方式编排对话流、图像流等复杂逻辑,并集成联网、文生图、语音合成等多样化插件。同时,平台开始支持发布至微信/抖音小程序、飞书等渠道,并引入团队协作、权限管理、SSO单点登录等企业级能力,完成了从玩具到工具的转型。
2025 年 12 月 17 日:「扣子开发平台」正式更名为「扣子编程」,内置AI 编程引擎,对标Manus、阿里1Day等,主要强调基于自然语言交互的Agentic AI应用构建体验。用户只需“清晰表达意图”,AI 自动生成完整应用(含前端界面、后端逻辑、API 接口、部署脚本),并支持一键发布为独立网站或 RESTful API。
🧩 核心设计理念
Coze 的产品哲学可以概括为三个关键词:生态协同、体验至上、闭源模式。
生态协同:深度集成字节跳动内部生态(如豆包、飞书、抖音),同时支持一键发布至微信、Web、Slack 等外部平台。工具插件优先集成飞书审批、日历、知识库、多维表格等企业服务;分发渠道天然打通抖音小程序、TikTok Bot、飞书机器人等。这种“生于生态、长于生态”的策略,使其在特定场景下拥有极强的网络效应和用户粘性。
体验至上:与 Dify 强调“可控性”不同,Coze 更倾向于“用产品力掩盖复杂性”。它牺牲了一定的底层灵活性,换取极致的上手速度和流畅的交互体验。无论是早期的自然语言建 Bot,还是后期的 Agentic 对话式编程,其目标始终是让非技术用户在最小认知负荷下完成任务。这种“黑盒但好用”的思路,非常符合 C 端和轻量级 B 端用户的心理预期。
闭源模式:模型方面主要对接 豆包大模型系列(包括 Skywork、Doubao 等),对第三方模型(如 GPT、Claude)的支持有限或需通过 API 间接接入。
💼 商业化模式
Coze 采用“积分(Points)”体系,将核心能力(如模型调用、工具使用、知识库容量等)统一转换为可消费的“积分”,通过不同套餐提供差异化配额。
Coze比较适合以下用户:
希望零代码快速构建并发布智能体的非技术用户(如产品、运营、内容创作者)
需要深度集成字节生态(如飞书、抖音、豆包)并实现一键分发的企业或团队
追求开箱即用、低运维成本,且对模型自主切换需求较低的中小团队或个人开发者
官网:https://dify.ai
GitHub:https://github.com/langgenius/dify
Dify 是一个开源的 LLM 应用开发平台,强调开源开放、社区活跃,主打通用的 Agent 与应用开发,兼顾个人与企业需求。自 2023 年底首次亮相以来,Dify 迅速成长为全球最受欢迎的开源 Agent 构建工具之一。
与早期 Coze 高度自动化的模式不同,Dify 自诞生之初就强调:在降低门槛的同时,不牺牲开发的灵活性与控制力。
📈 发展历程与产品形态演变
参考的更新日志:https://github.com/langgenius/dify/releases
2023 年(早期阶段)
Dify 最初由一群来自中国和北美的一线 AI 工程师发起,目标是解决 LangChain “灵活但难用”的痛点。早期版本聚焦于RAG 应用快速搭建,用户只需上传文档、选择模型,即可生成一个可对话的知识库 Bot。这一极简体验迅速在 Hacker News 和 GitHub Trending 上走红。
2024 年上半年(能力扩展期)
随着用户反馈增多,团队意识到“问答 Bot”只是起点。Dify 开始引入可视化工作流编辑器,支持拖拽式编排 LLM 节点、条件分支、API 调用等,使复杂 Agent 逻辑成为可能。同时,平台增加了对 Claude、Llama、ChatGLM 等非 OpenAI 模型的支持,确立了“模型中立”的技术路线。
2024 年下半年(企业化转型)
面向 B 端需求,Dify 推出团队协作功能、SSO 登录、API 密钥管理,并发布首个 Docker Compose 部署方案,支持私有化部署。此时,Dify 已从“个人玩具”演变为“可落地的企业级工具”。
2025 年至今(生态成熟期)
Dify 社区版 GitHub Star 突破 124k+(截止2026年初),贡献者超 1k+。官方同步推出 SaaS 云服务,提供免费沙盒与付费企业套餐。平台新增代码执行节点、多轮对话调试面板、向量数据库插件市场,进一步巩固其在开源 Agent 平台中的领先地位。
🧩 核心设计理念
可控性(Controllability):采用类似 Figma 的拖拽式界面,让开发者可以通过连接不同的节点(如 LLM 调用、条件判断、知识库检索、代码执行等)来编排复杂的 AI 应用逻辑,所见即所得的工作流编辑器。
开放性(Openness):这是 Dify 的灵魂。支持接入多种大语言模型,覆盖 GPT、Mistral、Llama3、Qwen 等几乎所有 OpenAI API 兼容模型。用户能根据场景灵活选择任意 LLM 与向量数据库;其插件机制也允许用户自由扩展工具集,不绑定任何特定云厂商。
工程友好(Engineering-First):提供完整的 DevOps 支持,包括Docker/K8s 部署、环境变量管理、详细的日志输出、API 调试接口。这让运维和安全团队能够放心地将 Dify 集成到企业现有的 IT 架构中,无后顾之忧。
💼 商业化模式
Dify 采用了典型的「开源核心 + SaaS 增值服务」相结合的双轨模式:
这种模式既保障了社区活力,又为商业化提供了可持续路径。
Dify 比较适合以下用户:
Dify官方和社区的Tuto都有很多,大家自由参考,我在这里就不展开了~
🔗 入门推荐:Dify 官方文档|快速启动Tutorials(点击查看原文可看链接)
⚠️注:Manus 由“蝴蝶效应”公司开发,于 2025 年 12 月 30 日被美国科技巨头 Meta 宣布收购,交易金额达 20 亿美元。截至 2026 年 1 月,该交易因涉及中国技术出口管制问题,正接受中国商务部审查。
Manus 对自己的定位是全球首款通用 AI 智能体,严格来说,它并非传统低代码平台,而是一个开箱即用的、具备自主执行能力的 AI 产品。
并且Manus 的故事充满了传奇色彩(论从初创到实现财富自由最短需要多久🐶):
📈 发展历程与产品形态演变
参考的更新日志:https://manus.im/zh-cn/updates
2022 年中(创业起点与技术积累)
创始人肖弘(曾打造微信生态工具“微伴助手”,服务超 200 万企业客户)在北京创立蝴蝶效应科技有限公司(Butterfly Effect),初期推出面向海外市场的 AI 浏览器插件 Monica。Monica 整合多模型聊天、写作、翻译功能,迅速积累超 1000 万用户并实现盈利,为后续 Manus 的研发奠定了产品、资金与国际化基础。
2023 年(公司架构完善,聚焦 Agent 赛道)
在真格基金撮合下,技术天才季逸超(猛犸浏览器作者)与产品专家张涛(前字节跳动高管)加入,形成核心铁三角。团队将方向转向更具颠覆性的 AI Agent(智能体)。
2024 年(原型验证期)
Manus 以闭门测试形式上线,核心功能是“Prompt-to-App”:用户输入一段需求描述(如“做一个能自动给 GitHub PR 写摘要的 Bot”),系统自动生成 Python 项目,包含 API、依赖、测试脚本。早期用户主要是硅谷初创公司 CTO,当时反馈极佳。后来Manus推出 Agentic Code Engine v1,引入任务分解(Task Decomposition)、工具选择(Tool Selection)、错误自修复(Self-Repair)机制。此时,Manus 不再只是代码生成器,而是一个具备规划能力的编程 Agent。同时期也逐步完成 A 轮融资。
2025 年 3 月 6 日(Manus 正式发布,引爆全球)
Manus 以“全球首款通用 AI 智能体”身份上线。一段展示其自动完成股票分析、旅行规划、简历筛选等复杂任务的演示视频迅速走红。采用邀请码制度后,引发抢购潮,邀请码在二手市场被炒至数万元人民币,官网 4 小时访问量破千万,7 天内等候名单突破 200 万人。
2025 年下半年:(商业化与收购)
推出分级订阅(Pro 版 199 美元/月),支持图像生成、文本转视频、Wide Research(调度百个子智能体并行研究)等高级功能。年底宣布 年度经常性收入(ARR)突破 1 亿美元,成为全球成长最快的 AI 初创公司之一。
然后Manus就被Meta收购了(字节也曾经想收购,但是没谈拢价格),而且Meta CEO 扎克伯格本人就是 Manus 忠实用户。经过仅十余天的谈判,Meta 宣布以 20 亿美元 收购 Manus。交易完成后,Manus 品牌与团队保持独立运营,创始人肖弘出任 Meta 副总裁,负责将 Manus 智能体能力深度整合进 WhatsApp、Instagram 等数十亿用户平台。
🧩 核心设计理念
Manus 的本质不是让你“搭建”Agent,而是让你“使用”一个超级 Agent。
从聊天到执行:不同于传统 Bot 提供信息,Manus 能直接操作电脑、调用 API、运行代码、生成文件,真正“把想法变成结果”。
产品即平台:虽然用户不直接“搭建”Agent,但 Manus 本身展示了一个高度封装、开箱即用的 Agentic 体验,启发了后续低代码平台对“执行能力”的重视。
从一定程度上来说,Manus的代表了Agentic AI 某一重要阶段性的用户形态,其“自然语言 → 自动执行”范式也正在被字节、MiniMax 等厂商借鉴,被Meta 收购后,其核心技术很可能反哺未来面向开发者的低代码工具链,成为 Meta 生态的基础设施。
💼 商业化与定位
Manus适合谁,这还用说吗?
C端用户,尤其是那些愿意为高生产力付费(其 Pro 版定价为 $ 199/月),并且其工作流涉及复杂、多步骤、需要跨工具协作并最终产出具体成果的用户(比如行业分析师、研究员等)。然后Manus尤其不适合对数据安全高度敏感的用户或场景,因为走的是纯闭源的SaaS 服务模式。
低代码 Agent 平台不是对传统高代码开发的替代,而是AI 应用开发生态中不可或缺的一环,是能力光谱的重要延伸。它让 AI Agent 从“少数人的魔法”变成了“多数人的工具”,这正是技术民主化最生动的体现。
展望未来,我们或许会看到以下几个相关趋势:
普通人成为“Agent 设计师”:随着 Agentic 对话交互的普及,创造 Agent 的核心技能将不再是写代码,而是清晰地表达需求、设计行为逻辑、甚至塑造 Agent 的人格。这将催生一种全新的职业角色——“Agent 设计师”。
Agent 应用商店的兴起:就像手机有 App Store 一样,未来可能会出现专门的 Agent 应用商店。agent经济会像liblib上的lora经济、微信小程序经济一样兴盛起来(目前也已经可见端倪)
Agentic OS:目前的低代码平台仍是运行在现有操作系统(Windows, macOS, iOS, Android)之上的应用。但长远来看,AI Agent 本身可能会成为下一代人机交互的核心原语,催生出全新的AI-Native Agentic OS。而且目前有好几家已经做了 比如Flowith OS、LimX COSA、孚知流等
好啦,再暂停一下!来恭喜你!
你已经看到了本 AI Agent系列专栏的第五篇文章了,很棒很棒!
下一站,我们将聊聊Agent OS —— 这个正在悄然崛起的新范式,或许将成为下一代人机交互与智能协作的基础设施。它不只是操作系统的演进,更是智能体(Agent)协同、调度与自治能力的集中体现。
如果你对AI Agent充满好奇,也欢迎关注我的公众号,千万别错过接下来的内容!