昨天晚上在某平台到一条消息,我当时正躺着刷手机,看到的瞬间,人立马坐起来了哈哈哈!
DeepSeek V4,要来了。
时间就在二月中旬,春节前后。距离上次V3.2发布,也就两个月左右。这个迭代速度,已经不是离谱了,是有点吓人。
但更离谱的,是内部测试的数据。
据The Information报道,DeepSeek内部员工自己跑的测试显示,V4在代码相关任务上的表现,可能超过Claude和GPT系列。
不是哥们,你看到这个“可能超过”没有?这用词,看着挺谦虚的,但你要知道,这可是他们内部自己测的。内部测试还敢这么说,那基本就是——真有货。
这次V4主打的是编程能力。你可能会问,写代码很重要吗?
我跟你说,非常重要。
AI写代码这件事,本质上考验的是模型的逻辑推理能力、上下文理解能力、还有对复杂任务的拆解能力。代码不像写文章,差不多就行,代码错一个字符都跑不起来。这就像考试,写作文你可以发挥,但数学题,答案不对就是零分。
所以编程能力强的模型,干别的活基本也不会差。
而且DeepSeek这个打法,我是真的服气。
从V3开始,他们就证明了一件事:开源架构+极低成本,一样能干出GPT级别的推理能力。这已经够狠了。
现在V4再往编程这个硬核赛道上扎,如果真的能超过Claude和GPT,那这个性价比简直是降维打击啊1
说实话,我现在最期待的,就是看到公开的benchmark跑分。内测数据说得再好,也得拿出来遛遛。我这个人,就是这么不浪漫。
但不管怎么样,DeepSeek这个节奏,确实让人兴奋。
二月中旬,春节前后。
到时候,咱们一起看看,这个“可能超过”,到底有多能打。
国内的AI模型厂商和工作人员,真的是用自己的方式,一点一点地推动国产AI模型的进步,加油!!!