最近 AI Coding 行业又涌现出一个新词“Harness Engineering”,不由得让我想起”古法编程“时代程序员的最大难题”起变量名“,看来 AI 写代码之后,程序员的起名天分就彻底放飞了:只要放弃了第一眼的可读性,起名字还是很简单的。虽然我对各种层出不穷的不说人话的名词没有太多好感,但是能够把一些工程上的核心概念让更多人知道,总体来说还是利大于弊的。
说到工程,就一定绕不开《工程控制论》,是 1954 年钱学森创立的,核心目标是让存在内部波动、外部干扰的动态系统,持续、稳定地输出符合预期的结果。2026 年的百虾大战,把软件工程师从数字电路拉到了模拟电路的层次:基于天生不稳定有幻觉的大模型,如何做到 100% 可靠的产品。(注:数字电路中只有 0 和 1,但模拟电路中实际上是不稳定的电压和电流,如何把不稳定转为稳定的 0 和 1,是现代计算机体系的基础)
对于纯提示词控制的项目来说,天花板很低,因为分分钟模型把这些能力给内化掉。但是融合 Skills、大模型和 Python 的完整工作流程,再融入人的环节(解决目前大模型无法解决的问题),基本上是确定性的生产力大提升。
核心灵魂:闭环负反馈机制
核心逻辑:系统输出结果后,和预期目标做对比,把偏差返回给输入端自动调整,形成"执行→校验→修正"的闭环,不需要人工干预
实际在开发过程中,“不需要人工干预”是一种完美状态,大部分时候,需要把验证的标准告诉 Agent,但是很多微妙的“感觉”难以用文字描述,大模型也难以从案例中学习,这需要在更高的维度来解决,简单来说就是我们要深入理解大模型的执行逻辑,直接给出更加工程化的方案。这要求我们有更强的表达能力,长期输出的工程师在这个时代有巨大的 AI 杠杆。
鲁棒性设计:抗干扰能力
核心逻辑:系统在内部参数波动、外部环境干扰的情况下,依然能保持稳定的性能,不会因为微小变化就崩溃。
实际在开发过程中,用任何格式都无法避免不规范的输出(如 JSON, YAML, CSV),首先是在大模型执行的上下游都需要做参数检查,用工程学的大招“不行就重试”来解决。比较好的方法是通过 CLI 的不同参数来控制,在输入时就进行“严进”,才能做到稳定的结果输出。针对 CLI 的参数,一定要设置好默认值,降低 Agent 执行过程中的智能负担,这样即使用更加便宜的模型(甚至本地模型),也能保证稳定性。试想,如果能用 9B 的模型在特定 skills 中实现 300B 以上大模型的效果,成本可以被极致压缩。
分层控制架构:警惕 Sub-Agent 陷阱
核心逻辑:把复杂系统拆成多层,高层负责战略决策,中层负责任务调度,底层负责具体执行,每层只负责自己的职责范围,不跨层干预,降低复杂度。
实际在开发过程中,一定要控制 Sub-Agent 的数量,假设一个 Agent 的可靠性是 90%,两个叠加并不一定是 81%(0.9 的平方),可能是 72.9%(0.9 的三次方),甚至是 65.61%(0.9 的四次方)。我称之为 Sub-Agent 陷阱:因为 Agent 的稳定性,收益可能远小于投入。
可观测性与可追溯性:能看到就能解决
核心逻辑:系统的每一个状态、每一步操作、每一次决策都要能被监控、被溯源,出问题能快速定位根因。
实际在开发过程中,如果只是把日志一股脑输出,试图让 Agent 自己搞定,基本上属于知心妄想。我的经验是一定要输出中间步骤的产物,通过累计一小步一小步的优化,最终得到整体的优化。对于长工作流,只在最终结果反馈,大模型会浪费大量 Token 去搜索和解决不重要的问题。最有效率的办法就是直接找到核心点,让大模型围绕这个核心点去优化方案,这才是最高效的方法。
冗余设计与容错机制:不仅要有 Plan B,还要有 Plan C
核心逻辑:关键路径做多重备份,单一组件失效不会影响整个系统的正常运行。
实际在开发中,如果一定要联网检索,那么就需要至少准备 2 个检索的工具。如果一个任务很关键,那么要用 3个不同的模型/Agent 独立执行,结果交叉验证,避免单个模型幻觉导致的错误。
写在最后
工程控制论诞生于1954,Harness Engineering 火在2026。72年过去了,我们面对的问题从导弹制导变成了AI Agent,但工程思维的内核从来没变过——如何在不确定性中构建确定性,在混沌中寻找秩序。这让我想起了冯诺依曼的另一句话:
在数学中,你并不理解东西,你只是习惯它们。
写代码久了,我们习惯了0和1的确定性,习惯了代码跑一遍就有确定结果的世界。但大模型把我们重新拉回了那个充满随机性的现实世界,像第一次面对模拟电路的工程师,像第一次面对惊涛骇浪的舵手。
AI 把生活的复杂暴露无遗,但工程思维就是把复杂变简单的那把钥匙。Skills 是你的工具箱,大模型是你的原材料,Python 是你的粘合剂,但最后把这一切组合成产品的,还是工程品味。