• # 用 AI 修复另一台 Linux 上的 AI Agent:一次 OpenClaw 宕机实战
很多人把 AI 只当“问答助手”,但它更有价值的方向是:让 AI 成为远程运维工程师。 这次我用 AI Codex,远程修复了一台 Ubuntu 服务器上 openclaw 服务无法使用的问题,流程很短,但方法可复用。
故障现象
- openclaw 显示网关不可达(127.0.0.1:18789 连接失败)
- 服务状态反复重启,无法稳定运行 ## AI 排障路径(可复制)
- 确认组件状态:openclaw status、systemd user service、端口监听
- 看日志找根因:journalctl --user -u openclaw-gateway.service
- 定位配置注入点:发现 proxy.conf 里有不兼容 NODE_OPTIONS
- 重启整机回归测试:确认开机自动恢复 ## 真实根因
日志明确报错:
- --experimental-fetch-proxy= is not allowed in NODE_OPTIONS 也就是 openclaw-gateway 启动时继承了一个 Node 22 不接受的参数,导致服务直接退出并进入重启循环。
修复动作
- 文件:~/.config/systemd/user/openclaw-gateway.service.d/proxy.conf
- 操作:删除 NODE_OPTIONS=...experimental-fetch-proxy...,保留普通 HTTP_PROXY/HTTPS_PROXY
- 执行: systemctl --user daemon-reload systemctl --user restart openclaw-gateway.service
验证结果(重启后)
- openclaw-gateway:enabled + active (running)
- openclaw status --all 显示 Gateway reachable ———
这件事的重点,不是“修好一次”
重点是一个新方向: 用 AI 去修复另一台机器上的 AI Agent、Linux 服务与服务器故障。 从“人盯日志”升级为“AI 执行排障闭环”,未来会是运维和 SRE 的高频工作流。