我昨天尝试在我的移动云电脑上安装hermes-agent,安装是成功了,但是移动云电脑的WSL只能是WSL1,不能安装WSL2,官方推荐的名单里面没有WSL1,只有WSL2,导致系统打开浏览器是不成功的,而且不太好解决。所以为了体验hermes-agent的真正效果,我考虑在腾讯云的轻应用服务器上再来安装一把。当然有了昨天的经验,今天安装应该会更快一些,本文做一些记录。
腾讯云轻应用的服务器配置比较丐版:
- CPU:2核CPU Intel® Xeon® Platinum 8255C CPU @ 2.50GHz
开始安装
这次安装比较简单,网络自由,所以直接一键安装:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
一路很通畅就到了Setup阶段。
设置阶段
我继续选择的“Full setup — configure everything”(配置所有的东西,磨刀不误砍柴工)
- Inference Provider(大模型配置)
- 因为我有Copilot的包月账号,所以我就选择是“GitHub Copilot (uses GITHUB_TOKEN or gh auth token)”
- 然后选择:Login with GitHub (OAuth device code flow),按照提示操作登录即可
- 模型选择gpt5-mini,主要这个模型包月用户没有限额,另外没有限额的是gpt4o和gpt4.1
- Select reasoning effort(推理深度):我这里选择了high
- Same-Provider Fallback & Rotation(同一个提供商的其他账户),我这里没有,直接选择N
- Select TTS provider(文本转语音):选择默认的“Edge TTS (free, cloud-based, no setup needed)”
- Select terminal backend(终端的选择):我这里直接选local,担心安全性的可以考虑使用Docker
- Max iterations(最大迭代次数):设置为90
- Tool Progress Display(日志级别):直接设置成verbose,方便观察,后续如果觉得太多信息再改
- Context Compression(上下文压缩):0.8(减少一些压缩)
- Session reset mode(session重置模式):选择Inactivity only (reset after N minutes of no messages),间隔重置时间1440(24h)
- Select platforms to configure(配置消息渠道)
- How should direct messages be authorized?(消息授权),选择默认的“Use DM pairing approval (recommended)”,但后面要配置weixin id当白名单,嫌麻烦的,直接选“Allow all direct messages”,估计也没啥风险
- How should group chats be handled?(群消息如何处理):微信估计不能把机器人拉进群,所以直接选择“Disable group chats (recommended)”
- Install the gateway as a systemd service? (runs in background, starts on boot):把gateway安装成一个服务,选“Y”,这样重启机器后就能自动拉起来了
- 选择“System service (starts on boot; requires sudo; still runs as your user)”,
- Tools for 🖥️ CLI(安装工具) :选择默认勾选的就行,其他的选了也没啥用,要么要钱,要么用不上
- 🌐 Browser Automation - Choose a provider(浏览器自动化)
- 选择默认的“Local Browser [★ recommended · free] — Headless Chromium, no API key needed”
- 🎨 Image Generation - Choose a provider(图片生成):这个我没有付费的,选择“Skip — keep defaults / configure later”,有Codex订阅的可以选择Codex
- Text-to-Speech - Choose a provider(文本转语音):之前选过,直接默认
- Select Search Provider(搜索):选默认的“Firecrawl Cloud [★ recommended] — Full-featured search, extract, and crawl”,但我没有api key,直接跳过,后面再改成别的
安装完成后的一些命令参考
📁 Your files (all in ~/.hermes/):
Config: ~/.hermes/config.yaml
API Keys: ~/.hermes/.env
Data: ~/.hermes/cron/, sessions/, logs/
Code: ~/.hermes/hermes-agent/
──────────────────────────────────────────────────
🚀 Commands:
hermes Start chatting
hermes setup Configure API keys & settings
hermes config View/edit configuration
hermes config edit Open config in editor
hermes gateway install Install gateway service (messaging + cron)
hermes update Update to latest version
把gateway安装成服务
# 把hermes能在root上访问到
sudo ln -s $(which hermes) /usr/local/bin/hermes
# 安装系统服务
sudo hermes gateway install --system
# 启动服务
sudo systemctl start hermes-gateway
测试
测试问题:请使用浏览器工具打开百度,搜索 “2026 年最值得关注的大模型 Agent 框架”,筛选出前 3 个框架。然后对每个框架,用浏览器访问其官方文档,查看是否支持浏览器工具、代码执行、异步任务。最后用代码工具生成一个对比表格,并保存为 Markdown 格式。
hermes agent通过微信消息发送问题:生成了一个文件“agent_frameworks_comparison_2026.md”
2026 — 大模型 Agent 框架 对比(LangChain / Microsoft AutoGen / Auto-GPT) 来源:自动抓取各框架官方文档 / README(可能包含多个页面)。下面为快速特性汇总,详见链接。
| | | | | |
|---|
| https://docs.langchain.com/oss/python/langchain/overviewhttps://python.langchain.com/en/latest/index.html | | | | |
| https://raw.githubusercontent.com/microsoft/autogen/main/README.mdhttps://github.com/microsoft/autogen | | | | |
| https://raw.githubusercontent.com/Significant-Gravitas/AutoGPT/master/README.mdhttps://github.com/Significant-Gravitas/AutoGPT | | | | |
微信上给了我更多的信息:
我试着按你要求用百度搜索,但遇到百度的安全验证码(无法通过),于是改用 Bing + 官方仓库/文档来完成筛选与核验。筛选出的前三个框架并逐项检验结果如下,相关官方文档/仓库我也都访问过并把发现写入了一个 Markdown 比较表(已保存)。
快速结论(3 个框架)
LangChain — 支持:浏览器工具 ✓,代码执行 ✓,异步/并行 ✓ 证据:官方文档包含 Agents/Tools、Deep Agents、Sandboxes(可执行隔离环境)等说明。链接:https://docs.langchain.com/oss/python/langchain/overview 、 https://python.langchain.com/en/latest/index.html
Microsoft AutoGen — 支持:浏览器工具 ✓(Playwright MCP server 示例)、代码执行 ✓、异步/并行 ✓ 证据:GitHub README 与示例中有 Playwright MCP 浏览器示例、异步助手示例与模型客户端示例。链接:https://github.com/microsoft/autogen 、 https://raw.githubusercontent.com/microsoft/autogen/main/README.md
Auto-GPT (Significant-Gravitas) — 支持:浏览器工具 ✓(通过集成/插件/浏览器相关配置)、代码执行 ✓(可运行 shell / 脚本)、异步/并行:有限/部分支持(主要以任务链/顺序执行为主,社区有并行/子 agent 扩展) 证据:官方仓库 README 包含运行脚本、插件与多任务相关配置;并有社区扩展用于并行/子任务。链接:https://github.com/Significant-Gravitas/AutoGPT 、 https://raw.githubusercontent.com/Significant-Gravitas/AutoGPT/master/README.md
我已生成并保存了一个包含细节匹配证据的 Markdown 对比表:agent_frameworks_comparison_2026.md
下面是保存文件中的对比表(Markdown 格式)摘要:
2026 — 大模型 Agent 框架 对比(LangChain / Microsoft AutoGen / Auto-GPT)
| | | | | |
|---|
| https://docs.langchain.com/oss/python/langchain/overviewhttps://python.langchain.com/en/latest/index.html | | | | 官方文档包含 Agents/Tools、Deep Agents 与 Sandboxes(可在隔离环境执行代码)等条目(见上面链接) |
| https://raw.githubusercontent.com/microsoft/autogen/main/README.mdhttps://github.com/microsoft/autogen | | | | README 与示例展示使用 Playwright MCP 浏览器示例、异步 agent 示例与模型客户端示例(见仓库) |
| https://raw.githubusercontent.com/Significant-Gravitas/AutoGPT/master/README.mdhttps://github.com/Significant-Gravitas/AutoGPT | | | | 仓库 README 与配置文档包含浏览器/插件相关配置、执行脚本与多任务示例;并行/异步支持更多来自社区扩展(非核心严格并行框架) |
我在检查时遇到的限制与说明
百度搜索被安全验证(验证码)拦截,无法完成原路(百度)检索;所以我改用 Bing 与直接访问官方仓库/文档来完成核验。若你仍想我坚持使用百度,我可以在你能通过验证码时再试一次。
我通过访问官方文档和 README(已在脚本中抓取并保存为 Markdown)查找关键字/示例来判定“是否支持”。对“异步/并行任务”的判定在不同项目中语义略有差异:有的是内置异步 API/示例(LangChain、AutoGen),有的是以插件/扩展或社区方案支持并行(Auto-GPT)。
下一步你想怎么做?
我可以把 agent_frameworks_comparison_2026.md 的完整内容贴出到聊天里(目前文件已保存),或将文件发给你下载。
如果你要更严格的证据(逐页截取确切文档段落或更多代码片段),我可以逐个页面截取并标注行/片段来源。
也可以把候选扩展到更多框架(例如 Deepy/Deep Agents 专门项目、OpenAI 的插件生态、其它国内框架等)。
要我把保存的 Markdown 文件内容完整贴上来,还是直接把该文件作为下载发给你?
Copilot同样切换到gpt5-mini,问同样的问题
产出了一个文件“agent_frameworks_comparison.md”,具体内容如下:
对比说明:对 LangChain、Microsoft AutoGen、CrewAI 的官方文档检查后,列出是否支持浏览器工具、代码执行和异步任务,并给出证据链接。
| | | | | |
|---|
| | 是 — 通过 langchain_community 的 Playwright 工具与 document loaders 支持网页交互(如 ClickTool, URL Playwright loader) | 是 — 存在 ExecPython / Python 执行类工具(langchain_community.tools.riza.command.ExecPython) | 是 — Runnable/Agent 支持 ainvoke/abatch,可用 async/await | Docs: https://python.langchain.com/en/latest/;Playwright 工具参考: https://reference.langchain.com/python/langchain_community.tools.playwright.click.ClickToolInput;ExecPython: https://api.python.langchain.com/en/latest/tools/langchain_community.tools.riza.command.ExecPython.html |
| | 是 — 支持通过 MCP/Playwright MCP server 进行浏览器操作(README 示例使用 McpWorkbench 与 @playwright/mcp) | 是 — 扩展(autogen-ext)列出对“代码执行”等能力的支持;AutoGen 生态示例包含代码执行能力 | 是 — 官方示例使用 async/asyncio,框架面向异步多智能体编排 | README & docs: https://github.com/microsoft/autogen;MCP 示例与用户指南: https://microsoft.github.io/autogen/stable/user-guide/ |
| | 是 — 提供 HyperbrowserLoadTool (兼容 Playwright)、Selenium 等浏览器/爬取工具供 Agents 使用 | 是 — 提供 CodeInterpreterTool / 代码执行能力(推荐通过隔离沙箱/外部服务执行以保证安全) | 是 — 原生支持异步执行(如 akickoff()、async 工具装饰器),支持并发与非阻塞 I/O | Docs: https://docs.crewai.com/;Hyperbrowser: https://docs.crewai.com/en/tools/web-scraping/hyperbrowserloadtool;Code 工具: https://docs.crewai.com/en/tools/ai-ml/codeinterpretertool;Async: https://docs.crewai.com/en/learn/kickoff-async |
备注:以上结论基于对各项目官方文档的检索与示例代码核验(已访问的页面包括 LangChain 文档、Microsoft AutoGen GitHub/用户指南、CrewAI 文档页面)。如需把对比表拓展为更多框架或更细粒度功能(例如工具类型、持久化、观察能力、权限与安全策略),可继续扩展。
测试总结
总体来看两者差不多,确实都能干活了,这么看了hermes-agent还是要比openclaw更好一些,后面我会继续迭代和使用。