Python+LangChain/LangGraph框架开发Ai智能体系列��29节 | LangChain项目如何引入Harness Engineering
核心理念:Agent = Model + Harness — 决定 Agent 质量的不再是模型,而是 Harness(驾驭层)
实践一:AGENTS.md — 把文档变成"免疫系统"
一句话:每次 Agent 犯错,就加一条规则,下次就不会再犯。
| |
|---|
| |
| 维护一个 AGENTS.md,每犯错就追加一条规则 |
| 命令 / 测试 / 项目结构 / 代码风格 / Git 工作流 / 边界 |
实践二:架构约束机械化执行
一句话:用 Linter + CI 门禁自动拦截坏代码,而不是靠人肉审查。
| |
|---|
| |
| Linter 错误消息 = 修复指令,不光是"报错" |
| Stripe:500 个工具 → 筛选到 15 个,准确率飙升 |
实践三:让应用对 Agent 可见
一句话:Agent 不能只看代码,还要能"看到"应用跑起来的样子。
| |
|---|
| |
| |
| OpenAI 用 Chrome DevTools Protocol 让 Agent "看到"页面 |
实践四:闭环自验证(Build-Verify Loop)
一句话:Agent 写完后自己跑测试验证,不通过就自动修复。
| |
|---|
| LLM 倾向"第一个看起来合理的方案"(不一定是正确的) |
| |
实践五:会话间记忆
一句话:Agent 重启后记得"上次做到哪了",像轮班交接日志。
| |
|---|
| |
| 用 JSON 文件记录进度(Agent 不会意外编辑 JSON) |
实践六:熵治理 — 对抗代码腐化
一句话:Agent 会放大代码库里的坏习惯,需要定期"打扫卫生"。
| |
|---|
| |
| 后台清理 Agent 定期扫描,自动开 PR 修复 |
实践七:并行管理与注意力分配
一句话:稀缺资源是"人类注意力",Agent 可以并行干活。
实践八:Blueprint 模式
一句话:确定性门禁"夹住"概率性 LLM,模型只是系统中的一个环节。
| |
|---|
| |
| LLM 生成代码 → 确定性检查(lint/test)→ 通过才放行 |
实践九:Trace 驱动的迭代改进
一句话:用数据(不是感觉)来优化 Agent——分析每次失败,针对性改进。
| |
|---|
| |
| 从 LangSmith 拉 traces → 分析错误模式 → 针对性改 harness |
实践十:渐进式采纳(六步法)
一句话:从"偶尔用一下"到"Agent 一直在跑",一步步来。
总结:一张图看懂十大实践
记住一个数字: 同一模型,仅改 Harness,性能可提升 10-60 倍。不是模型更强了,是 Harness 更好了。
扫码入群获取源码,后续分享更多系列教程关注公众号探索更多精彩内容!