编程SOTA? kimi k2.5真猛啊,把人脸都打肿了
现在的月暗确实有点牛,Kimi K2.5 在 Design Arena 上与 Gemini 3 和 Opus 4.5 处于同一性能梯队,并列第一。
这是一个历史性的成就,Design Arena 上排名最高的模型有史以来第一次是一个开源模型。
仔细复盘一下这家公司,你会发现它在AI四小虎里,绝对是走弯路最多的那一个,但商业世界有时候就是这么魔幻,在我看来,这些弯路反过来成就了它。
大家回想一下,提起Kimi,很多人脑子里蹦出来的第一个画面是什么?
肯定是当初那种铺天盖地的投流策略,那是真的在烧钱,到处都是Kimi的广告,结果后来发生什么事大家都知道了。
DeepSeek横空出世,从默默无闻到一夜之间家喻户晓,这一下对比就太强烈了,一边是烧钱买流量,一边是靠技术自来水漫灌,DeepSeek这一波操作,直接让Kimi之前的投流策略看起来非常尴尬,甚至有点搞笑了。
这种情况对于一家初创公司其实是非常危险的,你们想,原来烧的钱白烧了,闭源模型走不下去,如果按照常规剧本,大概率就是一蹶不振了。
但让我没想到的是,月暗果断,立久停掉了大规模投流。
这个决策在当时看来是极需勇气的,因为一旦流量断了,日活掉下来,下一轮融资怎么讲故事?但他们不但停了投流,后面还干了一件更绝的事,把模型开源了。
从闭源转开源,这意味着商业模式的根本性重构。这一段时间,外界看月暗是沉寂的,但是Kimi扛住了。
从K2发布后的重回大众视野,到最近K2.5发布后引发的惊呼,这一波触底反弹,月暗确实值得给一声喝彩。
K2.5发布后,我最近一直在观察全球开发者社区,很多人说K2.5现在的水平,至少有Claude 4.5 Opus八成的功力。
现在K2.5已经是开源编程界的扛把子了,很多人已经把它当成了Claude 4.5 Opus的完美平替。
而且现在流行一种操作策略,就是用Claude这来做规划,写Architecture,然后把具体的代码执行交给K2.5来干。
特别是在前端领域,我看到不少评测数据,K2.5现在的表现完全能和谷歌的Gemini 3掰手腕,甚至在某些Corner Case的处理上更细腻。
归根结底还是两个字:真香。
K2.5的使用成本太低了,对于开发者和企业来说,既然我也能达到90分的效果,为什么我要多花好几倍的钱去用更贵的呢?这就是最朴素的商业逻辑,真香定律在AI界永远适用。
数据显示,K2.5发布之后,Kimi的全球付费用户直接实现了4倍的增长。这些付费人群大部分是真正认可产品价值的专业用户,是那些愿意掏真金白银的开发者。
这就非常有意思了,原本以为是靠烧钱做C端,结果最后是靠技术硬实力切入了B端和开发者生态。
之前我就有一个观点,虽然现在国内大厂的AI应用声音很大,但说实话,到现在为止,没有一个大厂的产品能真正对标Anthropic。
大厂有大厂的包袱,既要顾及原有业务的利润,又要防守基本盘,这就注定很难做出那种纯粹的、极致的技术向产品。
举个例子来说,现在国内的SOTA编程模型,之前是智谱GLM4.7和MiniMax M2.1,现在则是K2.5,根本没大厂什么事。
所以我还是那个观点,Anthropic的真正对手,一定会从现在的AI四小虎里产生。
从目前的模型能力来看,月暗是最接近Anthropic的那一个,不过这也是暂时的,智谱GLM5出来也许又是另一番景象了。
咱们不妨大胆推演一下月暗现在的估值逻辑。
阿美的Anthropic现在的估值大概在3500亿刀之间,而且估值增长速度非常快,去年9月的时候,估值才1800亿,四个月翻倍了。
如果你承认月暗是目前国内唯一能在代码和逻辑推理上接近Anthropic的玩家,那它的估值应该多少?
我们就按最保守来估算,按照Anthropic估值的三十分之一,月暗估值也超过100亿刀了。
如果月暗能拿稳国内开发者生态的老大位置,并且在出海业务上像现在这样继续渗透,它撑起一个几百亿刀的市值,我觉得是一点问题都没有的。
这时候有人可能不以为人,认为它毕竟是开源,护城河不够深,大厂随时能卷死它。
其实,开源恰恰是它现在最深的护城河。当所有的开发者都在基于你的模型写代码,当所有的Agent都在调用你模型的API作为执行层,这种生态的粘性是很强的。
退一万步讲,就算最后月暗不独立上市,无论是被哪家巨头收购,那个价格绝对也是非常高的。
回看月暗走过的这一年多,从最初的融资明星,到投流争议,再到现在的翻盘。
我们正在见证一家公司如何在时代大风口中走出泥沼,用技术实力和信仰逆风翻盘。