研究了Hermes Agent之后,我顺手看了一眼GitHub排行榜,然后愣住了
Hermes Agent火了。
不到两个月,GitHub上7万star,341个贡献者。一家叫Nous Research的公司,2月25号刚开源的AI Agent框架,4月3号就发到了v0.7.0。
我前两天去研究了一下它到底做了什么,然后顺手看了一眼GitHub全球排行榜。
然后就愣住了。
排行榜上排第6的,是OpenClaw,35万star。排在它后面十几名的,是Linux,23万star。
我盯着这两个数字看了大概有半分钟。
一个1991年诞生的项目,养了35年,汇聚了全世界最顶尖的内核开发者,一千八百万行代码,运行在这个星球上几乎所有的服务器、安卓手机、超级计算机上。23万star。
另一个,2025年11月才开始写的周末项目,满打满算不到一年半。35万star。
不是哥们。
我寻思了一下我没寻思明白。
不是这两个项目谁更伟大,这种比较毫无意义。让我愣住的是,当Linux、OpenClaw、Hermes Agent这三件事串在一起的时候,我看到了一条让我后背有点发凉的暗线。
坦率的讲,以下可能会有一些暴论。你听听就好。
先说回Linux。
1991年,芬兰赫尔辛基,一个21岁的大学生Linus Torvalds,在自己的卧室里,写了一个操作系统的内核。他当时发了一条消息到新闻组,大意是,我正在写一个操作系统,就是玩玩,不会像GNU那样大和专业。
就是玩玩。
然后这个「就是玩玩」的项目,花了几十年时间,吃掉了整个服务器市场,成了安卓的底座,成了全球基础设施的基石。今天你刷的每一条抖音、发的每一条微信、搜的每一次Google,背后都有Linux在跑。
Linus的伟大不需要我多说。
但我想说的是另一件事。Linus做的事情,是给全世界搭了一层地基。这层地基太重要了,但它也是隐形的。你不会去感谢脚下的土地,但你知道没有它你什么都干不了。
而且,这个搭地基的过程,花了35年。
再说OpenClaw。
2024年11月,奥地利维也纳,一个叫Peter Steinberger的程序员,坐在电脑前,花了一个周末写了一个AI助手原型。
Peter这个人挺有意思的。他在做OpenClaw之前,做了43个项目,一个都没大成。他之前经营一家做了十几年的iOS开发工具公司叫PSPDFKit,做PDF开发工具的,日子不算差但也没什么波澜。他经历过三年的倦怠期,甚至一度觉得自己可能就这样了。
43个项目。三年倦怠。
然后他花了一个周末写了这么个东西。
一个给大语言模型操作系统级权限的AI Agent框架。
我第一次听说这个概念的时候愣了一下。给AI操作系统的权限?这不就是让AI直接操控你的电脑吗?
对,就是这个意思。
OpenClaw的核心想法其实非常简单粗暴。之前的AI不管多厉害,关在聊天框里,你问它答,你给它Prompt它给你回复,它是一个被动的知识库。但OpenClaw说不对,AI应该是一个能主动干活的东西。它能读你的文件、操作你的浏览器、执行你的命令行、调用你的各种工具。
它不是一个聊天机器人。它是一个干活的AI。
这个定位直接戳中了所有人的痛点。因为说实话,我们大多数人用AI的瓶颈从来不是AI不够聪明,而是AI够不着我们的工作环境。你让Claude帮你分析一个数据,它说我没办法访问你的文件系统。你让GPT帮你发一封邮件,它说我没办法操作你的邮箱。
就像你请了一个能力很强的助理,但把他关在一个隔音玻璃房里,所有工作交流只能通过对讲机。
OpenClaw就是把那个玻璃房给砸了。
然后这个项目就炸了。GitHub上大概用了四个月就超越了Linux的star数,成了GitHub史上增长最快的开源项目。到今天35万star,全球排名第6。Sam Altman亲自打电话给Peter请他去OpenAI。后来Peter真的去了。
一个大时代里的小细节。Peter在接受访谈的时候说了一句话,「用玩的心态去接近它,去做那个你一直想做却没做的项目。」
听着耳熟吗?
35年前Linus也说了差不多的话。
我正在写一个操作系统,就是玩玩。
好了,到这里都还是铺垫。因为开头提到的那个Hermes Agent,才是我觉得这个故事真正有意思的地方。
前面说了OpenClaw的核心是给AI操作系统权限,让AI从被动聊天变成主动干活。但Hermes Agent想的问题更深一层。
它问的是,如果AI已经能干活了,那它能不能越干越好?
Hermes的核心特性叫自我改进循环,self-improving loop。简单来说就是,这个Agent在你使用它的过程中,会从自己的经验中学习,自动生成新的技能,然后把学到的技能存进自己的记忆里,下次遇到类似问题的时候直接调用。
它不是一个工具。它在试图成为一个会成长的东西。
我第一次读到这个设计的时候,说实话,有一种很复杂的感觉。
一方面我觉得这太酷了。这不就是我们一直想要的吗,一个越用越懂你的AI,一个能记住你上次怎么处理问题然后下次自动处理的助手。想想就觉得兴奋。
但另一方面我突然意识到一件事。
我们从Linux到OpenClaw再到Hermes,其实经历了一条非常清晰的进化线。
Linux解决的问题是什么?给计算机一个稳定运行的底座。OpenClaw解决的问题是什么?给AI一个能干活的身体。Hermes解决的问题是什么?给AI一个能成长的心灵。
底座,身体,心灵。
你发现了吗。
我们在造人的过程中,走的每一步,都跟神话里造物主造人的顺序一模一样。这不是我刻意往这个方向引,你仔细想。Linux提供了骨骼和血液,基础设施。OpenClaw提供了双手和工具,执行能力。Hermes在试图提供大脑的进化机制,自我学习。
以前我们说AI的发展很快,但那种快还是在一个维度上的快。模型参数从7B到70B到700B,推理能力从做小学生的题到做研究生的题到做博士的题。但这种进步是线性的,只是让同一个东西变得更强。
而Agent这条线的进化,是维度的跳跃。
它不是让AI变得更聪明,而是让AI从只能想变成了能想也能做,再从能做变成了能学会做更多。
这是质的区别。
好了,到这里可以开始说暴论了。
第一,模型之争是伪命题。
过去两年,全世界的目光都盯着大模型。GPT vs Claude vs Gemini vs DeepSeek,谁跑分高谁赢,谁在排行榜上第一谁牛逼。我身边的朋友圈隔三差五就传什么模型屠榜了什么模型超越人类了。
但说真的,我觉得这是在盯着肌肉看,而忽略了骨骼。
模型是肌肉。肌肉当然重要,越强越好。但没有骨骼,再强的肌肉也只是一坨肉。
Agent是骨骼。它决定了AI的能力怎么被释放出来,在什么场景下被使用,怎么跟真实世界交互。
你看GPT-4在2023年就已经很强了,但你日常用它的方式,大概率还是打开一个网页,打字,然后看它回复。这个交互范式跟2022年ChatGPT刚出来的时候,有本质区别吗?
没有。
因为Agent层没跟上。
所以下一个时代真正的赢家,大概率不是那个做出最强模型的团队。而是那个做出最好Agent框架的团队,以及建立在这个框架之上的生态系统。
就像PC时代,赢家不是做CPU的Intel,是做操作系统的微软。
第二个暴论。操作系统的时代可能真的要结束了。
这句话听着太狂了,我自己写出来都有点心虚。但我想了想还是得说。
Peter Steinberger在接受OpenAI访谈的时候说过一句很著名的话,80%的App将会消失,AI将接管你的电脑。
很多人把这句话当成一种营销话术听听就过了。但如果你把Linux、OpenClaw、Hermes这三件事串起来看,你会发现这句话的分量完全不一样。
Linux时代,操作系统是中心。你通过操作系统来使用软件,通过软件来完成任务。操作系统是所有交互的入口。苹果和微软争夺的,就是这扇门。
但在Agent时代,这个逻辑被反转了。当AI Agent可以直接读你的文件、操作你的浏览器、帮你发邮件、帮你分析数据、帮你做PPT的时候,你还需要打开一个个App吗?
你不需要了。你只需要说一句,帮我搞定这个事,Agent会自己去操作所有需要的东西。
当交互方式从打开软件学习操作完成任务,变成说一句话AI直接完成,App就成了一个不必要的中间层。
操作系统的角色也会从一个主动的平台变成一个被动的地基。你不再「使用」操作系统,你甚至感知不到它的存在。
就像你现在不会去「使用」Linux一样。你的手机里跑着Linux内核,但你感知不到它。未来你的电脑里可能跑着各种Agent,你也感知不到底层是什么东西。
第三个暴论。Hermes的自我进化路径,才是真正该让我们兴奋到睡不着的东西。
OpenClaw解决了AI能不能干活的问题。Hermes在解决AI能不能越干越好。这两个问题的重要性根本不在一个量级上。
前者是一个工程问题,只要框架搭好了、权限给够了、工具链完善了,AI就能干活。它的天花板是可见的。
后者是一个范式问题。如果AI真的能从每一次交互中学习,从每一次错误中改进,从每一次成功中提炼技能,那这个系统的上限在哪?
我不知道。说实话我也不确定。
但我知道一件事,就是**人类之所以成为这个星球上最厉害的物种,靠的不是一次性的智力,而是学习、积累、传承的能力。**单个人的智力是有上限的。但人类的文明可以持续进步,因为每一代人都可以站在上一代人的肩膀上。
Hermes做的事情,在某种程度上,就是在给AI创造同样的机制。
这让我想到一个很有意思的对比。有人写了一篇文章说,OpenClaw把AI当成一个需要协调和指挥的工具集,而Hermes把AI当成一个需要培养和发展的心灵。
两种完全不同的哲学。一个是工程思维,一个是成长思维。
短期来看,OpenClaw的工程思维可能更实用,因为你现在就需要AI帮你干活。但长期来看,我觉得Hermes的方向可能更接近终局。
因为最终,我们需要的不是一个永远需要我们告诉它怎么做的工具。我们需要的是一个能自己成长的伙伴。
第四个暴论。下一个Linus,大概率不会是程序员。
Linus是程序员,Peter也是程序员,这两个人都是靠写代码改变了世界。但我有一个直觉,下一个在这个链条上产生突破的人,可能不是写代码的。
为什么?
因为Agent时代降低了编程的门槛。当AI自己能写代码、能调试、能部署的时候,「会不会编程」就不再是一个瓶颈了。
真正稀缺的能力变成了什么?
是「想清楚要让AI做什么」。
是定义问题的能力,是设计工作流的能力,是理解人类需求并翻译成AI能执行的指令的能力。这些东西,程序员不一定擅长。产品经理可能更擅长,甚至一个对某个行业有深度理解的普通人可能比所有人都擅长。
说真的我自己也还在摸索这个方向,可能有些想法还不成熟。但我有时候觉得,未来五年最成功的AI创业者,可能不是从硅谷或者中关村出来的,而是从一些你意想不到的地方冒出来的。就像Linus来自芬兰,Peter来自奥地利。
好的想法不需要出生在正确的地方。它只需要出生在一个充满好奇心的大脑里。
最后一个,也是最让我觉得想说出来的一个。
信息差永远存在,而且在越变越大。
你想想看,OpenClaw现在35万star,Hermes Agent现在6万多star,在GitHub上排名前300。但在AI从业者之外,有多少人知道这两个项目?
我猜不到5%。
大多数人还在讨论ChatGPT什么时候出GPT-6,还在研究怎么写更好的Prompt,还在纠结Claude和Gemini哪个更适合写周报。
而与此同时,一群人在GitHub上默默地搭着下一代的数字基础设施。这些基础设施会在某一天突然出现在每个人的生活里,就像Linux一样。到时候大多数人甚至不知道它的名字,但已经在用它了。
这种感觉太熟悉了。
1991年Linus写了Linux,但真正普及到普通人生活里是什么时候?是安卓手机爆发的时候,是2010年前后。中间隔了将近20年。
2004年Facebook上线,但社交媒体真正改变每个人的日常生活是什么时候?是2012年前后智能手机全面普及之后。中间隔了8年。
AI Agent从技术成熟到全面渗透到普通人生活,中间会隔多久?
我不知道。但我觉得会比8年短得多。可能3到5年。因为这一次传播的基础设施已经建好了,智能手机已经人手一台了,而且AI本身就在加速这个过程。
所以如果你现在还没开始关注Agent这个方向,我真诚的建议你,花点时间了解一下。不是为了追热点,是因为这可能是有生之年你能亲眼见证的最大的技术范式转移之一。
你不需要成为开发者。你只需要知道这个世界上正在发生什么。
说到这里我突然想起来一件事。
Peter Steinberger在做出OpenClaw之前,做了43个项目,全部没成功。他经历了三年的倦怠期,觉得自己可能这辈子就这样了。
Linus Torvalds写Linux的时候,也根本没觉得这玩意会变成什么了不起的东西,就是觉得好玩。
Nous Research做Hermes Agent的时候,Agent赛道上已经有无数个竞争者了,没人觉得还需要一个新的框架。
这三件事有什么共同点?
就是他们做这些事情的时候,都不是为了改变世界。
他们只是在好奇心的驱动下,做了一个自己觉得有意思的东西。
Linus想玩操作系统,Peter想让AI能真正干活,Nous Research想让AI能自己变强。就这么简单。
改变世界从来不是一个目标。它是一个副产品。
是好奇心和持续行动的副产品。
我始终坚信这一点。
我们正站在一个很有意思的节点上。Linux花了35年证明了开源可以重塑世界的基础设施。OpenClaw用了不到一年半证明了同样的力量可以在AI时代以100倍的速度重演。而Hermes Agent刚刚起步,正在试图回答一个我们从来没认真想过的问题,如果AI能自己成长,世界会变成什么样?
我不知道答案。
但我知道一件事。
永远对世界保持好奇。
因为下一个改变世界的周末项目,可能就正在某个人的卧室里诞生。就像35年前的Linus,一年半前的Peter,和此刻某个你不知道名字的人。
磨平一些信息差。哪怕只是很小很小的一点。那我也觉得,我做了一些正确的事。