为什么纯终端OpenCLI这么难?
相信很多玩Hermes Agent的朋友都遇到过这个问题:网上99%的OpenCLI教程都是基于桌面环境的。
但我们的AI助手大多部署在云服务器或者内网的纯字符终端Ubuntu上,总不能为了个浏览器专门装个桌面吧?
无头浏览器?那玩意儿又重又不稳定,还经常被各种网站反爬检测,体验一言难尽。
真正的生产力工具,应该能在最朴素的环境下发挥最大的价值。
经过两天的踩坑调试,我终于找到了完美解决方案:用Xvfb虚拟桌面+Chrome浏览器+OpenCLI插件,在纯Linux终端环境下实现了完整的OpenCLI功能。
现在我的Hermes Agent可以直接调用OpenCLI,无缝访问B站、知乎、小红书、雪球等几乎所有主流网站,获取结构化数据。
一、OpenCLI纯终端环境完整部署
1. 基础环境准备与OpenCLI安装
首先确保你的系统已经安装了Node.js 21以上版本,这是OpenCLI的硬性要求。
# 检查Node.js版本 node --version # 全局安装OpenCLI npm install -g @jackwener/opencli
安装完成后,先不要急着运行,我们还需要解决最关键的浏览器问题。
2. 安装Chrome浏览器与OpenCLI插件
这里有个关键技巧:我们先通过MobaXterm的Xserver功能,在本地显示服务器上的Chrome界面,完成插件安装和网站登录。
前提是你的Ubuntu服务器已经安装了google-chrome-stable,并且本地使用MobaXterm_Personal_25.0或其他支持X11转发的终端工具。
# 在MobaXterm中SSH登录服务器后,直接运行 google-chrome
此时MobaXterm会自动弹出Chrome浏览器窗口,和你在本地使用完全一样。
接下来打开Chrome的扩展管理页面,开启开发者模式,点击"加载已解压的扩展程序",选择你已经下载到服务器上的opencli-extension目录。
这一步是整个流程的核心:先在可视化界面完成所有一次性配置,再转到后台运行。
3. 登录所有需要使用的网站
在弹出的Chrome窗口中,依次登录以下网站并保持登录状态:
这些登录状态会被Chrome保存,后续后台运行时依然有效。
4. 安装Xvfb虚拟桌面
Xvfb是一个轻量级的虚拟显示服务器,可以让图形程序在没有物理显示器的环境下运行。
# 安装Xvfb sudo apt update && sudo apt install -y xvfb
安装完成后,任何通过xvfb-run启动的图形程序,都会在这个虚拟桌面中运行。
5. 后台启动Chrome浏览器
现在我们可以关闭刚才通过Xserver打开的Chrome窗口,然后在后台启动一个新的Chrome实例。
# 后台启动Chrome,输出重定向到日志文件 nohup xvfb-run google-chrome >> chrome.log &
这样Chrome就会在Xvfb虚拟桌面中安静地运行,不会占用任何前台资源。
6. 检查OpenCLI健康状态
最后一步,运行OpenCLI的健康检查命令,确认所有组件都正常工作。
# 检查OpenCLI运行状态 opencli doctor
当你看到"Everything looks good!"的提示时,恭喜你!纯终端环境下的OpenCLI已经完美部署完成了。二、让Hermes Agent用上OpenCLI
1. 安装opencli-skill技能
现在我们需要给Hermes Agent安装OpenCLI技能,让它知道如何调用这个强大的工具。
直接告诉Hermes Agent:
帮我安装这个OpenCLI技能:https://github.com/GloriaGuo/opencli-skill
等待安装成功后,Hermes就会自动加载这个技能,并了解所有OpenCLI的使用方法。
2. 实测:让Hermes用OpenCLI搜索股票信息
现在是见证奇迹的时刻!我们来测试一下实际效果。
告诉Hermes Agent:
使用$opencli在雪球搜索关于恒瑞医药的最新信息,整理核心内容后发送给我。
几秒钟后,你就会收到Hermes通过OpenCLI获取并整理好的结构化信息,包括股价、成交量、市值、相关新闻等关键数据。
这不是简单的网页抓取,而是真正模拟人类浏览器行为的结构化数据获取。
我测试了B站热榜、知乎搜索、小红书内容、今日头条新闻等多个场景,全部完美运行。OpenCLI会自动处理登录状态、反爬检测、数据解析等所有复杂问题,返回给Hermes干净的JSON格式数据。
价值升华:自主可控的AI信息获取能力
这次成功部署,让我对"养马"系统有了更深的理解。
我们追求的不是一个只能在本地电脑上玩玩的玩具,而是一个可以部署在任何服务器上、7×24小时不间断运行、真正能为我们干活的AI助手。
OpenCLI解决了AI Agent最大的痛点之一:如何稳定、可靠、自主地获取全网信息。它不需要昂贵的API调用,不需要依赖第三方服务,所有数据都在你的掌控之中。
拒绝黑盒,自主可控,这才是个人AI助手的终极形态。
当然,这只是开始。接下来我会继续探索OpenCLI的更多高级用法,比如批量下载、自动化任务、多Agent协作等。
如果你在部署过程中遇到了任何问题,或者有更好的优化方案,欢迎在评论区留言交流。我们一起把"养马"这件事做得更好。
本文所有步骤都经过实际测试验证,可直接复制使用。
如果觉得对你有帮助,欢迎点赞、在看、转发给更多需要的朋友。
有任何问题或建议,欢迎在评论区留言,我会尽量回复。
© 2026 养马系列技术专栏 | 专注于个人AI助手的自主可控与生产力提升
关注我,获取更多AI Agent实战干货