你好,我是蔚公子,毕业ALL in AI,专注于 AI 提效/教育
点击👇关注我,帮助 AI 小白轻松入门,一起 AI 创富
今天在检索信息的过程中,突然看到这个新闻,瞬间有了精神:
2025年1月,DeepSeek-R1上线,此时正值R1模型发布一周年之际,DeepSeek新模型“MODEL1”曝光。
不是才说2月发布吗,怎么会是今天?!
于是蔚公子紧急研究了一手,总算是弄明白其中缘由,废话不多说,直接给大家带来第一手资讯🔥
一、发生了什么
就在今天,DeepSeek 官方的 GitHub 仓库悄悄更新了一系列 FlashMLA 代码。
有开发者第一时间对这全部 114 个代码文件(包括 .py, .md, .txt, .sh, .cpp, .cu, .h 文件)进行了地毯式分析。
结果,发现了一个此前从未公开的架构标识——“MODEL1”。
它在代码中一共被提及了31 次。
这就有点反常了🤔。
结合这几天正好是 DeepSeek-R1 发布一周年的日子,网友们纷纷猜测:
这个 MODEL1,很可能就是传闻中 DeepSeek 即将在春节前后发布的新模型代号。
而且,有开发者发现 MODEL1 的硬件实现,竟跨越了多个 GPU 架构:
MODEL1的硬件实现跨越多个GPU架构。在英伟达H100/H200(SM90架构)上有两个版本:model1_persistent_h64.cu用于64头配置,model1_persistent_h128.cu用于128头配置。
在最新的B200(SM100架构)上有专门的Head64内核实现,而SM100的Head128实现仅支持MODEL1,不支持V3.2。
这说明什么?
有人猜测 DeepSeek 为了适配英伟达新一代 GPU,专门给 MODEL1 开了小灶,优化了架构。
意味着,如果这波大家没猜错的话,新模型在硬件亲和力上,真是是“亲儿子”级别的。
二、新模型能力业界推测
基于代码细节,现在普遍有两个的推测:
第一,它可能是一个极致高效的推理模型。相比 V3.2,它的内存占用更低。这意味着它非常适合边缘设备,或者那些对成本极其敏感的场景。
第二,它可能是一个“长序列专家”。针对 16K+ 序列进行了深度优化,非常适合文档理解、代码分析等长上下文任务。
同样重要的消息,差不多两周前的1月9日,外媒就援引知情人士消息称:DeepSeek 将于 2月中旬,也就是春节前后发布其下一代模型。
重点是主打编程能力。据说在内部测试中,已经在多个基准上超越了 Claude 与 GPT 系列。
看来,春节大家又不能好好休息了,准备迎接“深水炸弹”吧!🧨
三、海外评价DeepSeek一周年
恰逢 DeepSeek R1 发布一周年,国外刚好也出了一篇极有意义的文章,Hugging Face 官方博客专门发了一篇特别文章——《One Year Since the “DeepSeek Moment”》(DeepSeek 时刻一周年)。
https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment文章系统回顾了过去一年中国开源社区的集体爆发,HF 认为,R1 模型的开源不仅仅是个模型,它降低了三重壁垒:1.推理技术壁垒
2.生产部署壁垒
3.心理壁垒
更重要的是,它推动了国内公司在开源方向上,形成了一种非协同但高度一致的战略走向。
可以说,中国 AI,真的在慢慢起来。🌏
四、蔚公子的洞察
最后,我想聊聊 DeepSeek 这家公司给我的感觉。
首先,他们有自己的“时钟”。纵观 DeepSeek 一年以来的动向,你会发现,他们并没有完全被外界的声音打扰,而是一直有着自己的行动日程。外面吵翻天,他们只管写代码。
其次,你是质疑者,我是解题人。每当业界对其有所质疑,或有一些通用性的瓶颈问题发生时,他们总能给出自己的解决方案。
尤其是近期的几个更新以及论文的产出,都刚好对应当时AI圈内比较重大的议题,但巧合度实在是有点高🥲
再者,潜龙在渊。有意思的是,在研究 AI 的过程中,他们量化的成绩同样亮眼。在一边分心做量化的情况下数据依然能打,这说明什么?说明他们可能还未尽全力。
最后,必须点赞的是他们始终是用自有资金来参与这一轮的 AI 竞争。不烧投资人的钱,每一分都花在刀刃上,却依然能屡屡在榜单上杀出重围。
这种纯粹和实力,值得我们每一个创业者瑞思拜。🫡
期待 2 月,DeepSeek 给我们带来更大的惊喜✨
好,今天分享就是这些了~
也欢迎大家在评论区留下自己的思考,同时如果能点个赞和转发,就是对我最大的鼓励。
要是喜欢我的分享,不想错过每篇文章,可以设置⭐标,我们下期,不见不散✨
快收藏起来,慢慢探索,相信它能成为你提升效率的得力助手!
AI时代滚滚而来,不以任何人的意志为转移,而我们首先能做的,就是利用这些AI工具提高我们的效率。
与其抱怨 AI 不够聪明,不如学会用对方法,让 Al 成为你最得力的助手。
如果你觉得今天的分享对你有帮助,别忘了收藏起来,也欢迎分享给同样在职场/教育领域奋斗的伙伴们。下一篇,我们将分享更多让工作事半功倍的"效率秘籍",记得关注不要错过!
在评论区留下你最想了解的效率提升话题,下期内容说不定就是为你量身定制的!
如果有启发,别忘了给我点个赞、在看、转发~因为你的反馈真的很重要!
我是蔚公子,毕业后不上班,用 AI 打造一人企业。
近一年输出了大量 AI 实操干货,是一名小红书万粉博主,抖音播放100w+,视频号播放80w+,正在探索 AI 工作流赋能提效我的所有工作。
未来已来,职场人的分水岭会变得异常清晰——你是站在AI浪潮崛起的阵营内,还是沦为数字时代的局外人?
欢迎加我的微信(zxxx1111111112),备注“公众号”,送你
1️⃣一份详细的AI入门学习宝典
2️⃣一个百人AI交流社群
3️⃣清华等知名大学出品DeepSeek教程
4️⃣AI领域相关最新资料
5️⃣蔚公子独家十大AI赋能教学网页
6️⃣蔚公子独家设计PPT原稿
7️⃣AI领域最新爆火论文
免费领取,先到先得。