当前位置：首页>java>代码泄密!DeepSeek一周年,新模型“MODEL1”曝光

代码泄密!DeepSeek一周年,新模型“MODEL1”曝光

2026-06-24 17:51:10

你好，我是蔚公子，毕业ALL in AI，专注于 AI 提效/教育

点击👇关注我，帮助 AI 小白轻松入门，一起 AI 创富

今天在检索信息的过程中，突然看到这个新闻，瞬间有了精神：

2025年1月，DeepSeek-R1上线，此时正值R1模型发布一周年之际，DeepSeek新模型“MODEL1”曝光。

不是才说2月发布吗，怎么会是今天？！

于是蔚公子紧急研究了一手，总算是弄明白其中缘由，废话不多说，直接给大家带来第一手资讯🔥

一、发生了什么

就在今天，DeepSeek 官方的 GitHub 仓库悄悄更新了一系列 FlashMLA 代码。

有开发者第一时间对这全部 114 个代码文件（包括 .py, .md, .txt, .sh, .cpp, .cu, .h 文件）进行了地毯式分析。

结果，发现了一个此前从未公开的架构标识——“MODEL1”。

它在代码中一共被提及了31 次。

这就有点反常了🤔。

结合这几天正好是 DeepSeek-R1 发布一周年的日子，网友们纷纷猜测：

这个 MODEL1，很可能就是传闻中 DeepSeek 即将在春节前后发布的新模型代号。

而且，有开发者发现 MODEL1 的硬件实现，竟跨越了多个 GPU 架构：

MODEL1的硬件实现跨越多个GPU架构。在英伟达H100/H200（SM90架构）上有两个版本：model1_persistent_h64.cu用于64头配置，model1_persistent_h128.cu用于128头配置。

在最新的B200（SM100架构）上有专门的Head64内核实现，而SM100的Head128实现仅支持MODEL1，不支持V3.2。

这说明什么？

有人猜测 DeepSeek 为了适配英伟达新一代 GPU，专门给 MODEL1 开了小灶，优化了架构。

意味着，如果这波大家没猜错的话，新模型在硬件亲和力上，真是是“亲儿子”级别的。

二、新模型能力业界推测

基于代码细节，现在普遍有两个的推测：

第一，它可能是一个极致高效的推理模型。相比 V3.2，它的内存占用更低。这意味着它非常适合边缘设备，或者那些对成本极其敏感的场景。

第二，它可能是一个“长序列专家”。针对 16K+ 序列进行了深度优化，非常适合文档理解、代码分析等长上下文任务。

同样重要的消息，差不多两周前的1月9日，外媒就援引知情人士消息称：DeepSeek 将于 2月中旬，也就是春节前后发布其下一代模型。

重点是主打编程能力。据说在内部测试中，已经在多个基准上超越了 Claude 与 GPT 系列。

看来，春节大家又不能好好休息了，准备迎接“深水炸弹”吧！🧨

三、海外评价DeepSeek一周年

恰逢 DeepSeek R1 发布一周年，国外刚好也出了一篇极有意义的文章，Hugging Face 官方博客专门发了一篇特别文章——《One Year Since the “DeepSeek Moment”》（DeepSeek 时刻一周年）。

https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment

文章系统回顾了过去一年中国开源社区的集体爆发，HF 认为，R1 模型的开源不仅仅是个模型，它降低了三重壁垒：

1.推理技术壁垒

2.生产部署壁垒

3.心理壁垒

更重要的是，它推动了国内公司在开源方向上，形成了一种非协同但高度一致的战略走向。

可以说，中国 AI，真的在慢慢起来。🌏

四、蔚公子的洞察

最后，我想聊聊 DeepSeek 这家公司给我的感觉。

首先，他们有自己的“时钟”。纵观 DeepSeek 一年以来的动向，你会发现，他们并没有完全被外界的声音打扰，而是一直有着自己的行动日程。外面吵翻天，他们只管写代码。

其次，你是质疑者，我是解题人。每当业界对其有所质疑，或有一些通用性的瓶颈问题发生时，他们总能给出自己的解决方案。

尤其是近期的几个更新以及论文的产出，都刚好对应当时AI圈内比较重大的议题，但巧合度实在是有点高🥲

再者，潜龙在渊。有意思的是，在研究 AI 的过程中，他们量化的成绩同样亮眼。在一边分心做量化的情况下数据依然能打，这说明什么？说明他们可能还未尽全力。

最后，必须点赞的是他们始终是用自有资金来参与这一轮的 AI 竞争。不烧投资人的钱，每一分都花在刀刃上，却依然能屡屡在榜单上杀出重围。

这种纯粹和实力，值得我们每一个创业者瑞思拜。🫡

期待 2 月，DeepSeek 给我们带来更大的惊喜✨

好，今天分享就是这些了～

也欢迎大家在评论区留下自己的思考，同时如果能点个赞和转发，就是对我最大的鼓励。

要是喜欢我的分享，不想错过每篇文章，可以设置⭐标，我们下期，不见不散✨

快收藏起来，慢慢探索，相信它能成为你提升效率的得力助手！

写在最后

AI时代滚滚而来，不以任何人的意志为转移，而我们首先能做的，就是利用这些AI工具提高我们的效率。

与其抱怨 AI 不够聪明，不如学会用对方法，让 Al 成为你最得力的助手。

如果你觉得今天的分享对你有帮助，别忘了收藏起来，也欢迎分享给同样在职场/教育领域奋斗的伙伴们。下一篇，我们将分享更多让工作事半功倍的"效率秘籍"，记得关注不要错过！

在评论区留下你最想了解的效率提升话题，下期内容说不定就是为你量身定制的！

如果有启发，别忘了给我点个赞、在看、转发～因为你的反馈真的很重要！

我是蔚公子，毕业后不上班，用 AI 打造一人企业。

近一年输出了大量 AI 实操干货，是一名小红书万粉博主，抖音播放100w＋，视频号播放80w＋，正在探索 AI 工作流赋能提效我的所有工作。

未来已来，职场人的分水岭会变得异常清晰——你是站在AI浪潮崛起的阵营内，还是沦为数字时代的局外人？

欢迎加我的微信（zxxx1111111112），备注“公众号”，送你

1️⃣一份详细的AI入门学习宝典

2️⃣一个百人AI交流社群

3️⃣清华等知名大学出品DeepSeek教程

4️⃣AI领域相关最新资料

5️⃣蔚公子独家十大AI赋能教学网页

6️⃣蔚公子独家设计PPT原稿

7️⃣AI领域最新爆火论文

免费领取，先到先得。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

代码泄密!DeepSeek一周年,新模型“MODEL1”曝光

今天在检索信息的过程中，突然看到这个新闻，瞬间有了精神：

2025年1月，DeepSeek-R1上线，此时正值R1模型发布一周年之际，DeepSeek新模型“MODEL1”曝光。

二、新模型能力业界推测

基于代码细节，现在普遍有两个的推测：

第一，它可能是一个极致高效的推理模型。相比 V3.2，它的内存占用更低。这意味着它非常适合边缘设备，或者那些对成本极其敏感的场景。

第二，它可能是一个“长序列专家”。针对 16K+ 序列进行了深度优化，非常适合文档理解、代码分析等长上下文任务。

同样重要的消息，差不多两周前的1月9日，外媒就援引知情人士消息称：DeepSeek 将于 2月中旬，也就是春节前后发布其下一代模型。

重点是主打编程能力。据说在内部测试中，已经在多个基准上超越了 Claude 与 GPT 系列。

看来，春节大家又不能好好休息了，准备迎接“深水炸弹”吧！🧨

三、海外评价DeepSeek一周年

四、蔚公子的洞察

最后，我想聊聊 DeepSeek 这家公司给我的感觉。

首先，他们有自己的“时钟”。纵观 DeepSeek 一年以来的动向，你会发现，他们并没有完全被外界的声音打扰，而是一直有着自己的行动日程。外面吵翻天，他们只管写代码。

其次，你是质疑者，我是解题人。每当业界对其有所质疑，或有一些通用性的瓶颈问题发生时，他们总能给出自己的解决方案。

尤其是近期的几个更新以及论文的产出，都刚好对应当时AI圈内比较重大的议题，但巧合度实在是有点高🥲

再者，潜龙在渊。有意思的是，在研究 AI 的过程中，他们量化的成绩同样亮眼。在一边分心做量化的情况下数据依然能打，这说明什么？说明他们可能还未尽全力。

最后，必须点赞的是他们始终是用自有资金来参与这一轮的 AI 竞争。不烧投资人的钱，每一分都花在刀刃上，却依然能屡屡在榜单上杀出重围。

这种纯粹和实力，值得我们每一个创业者瑞思拜。🫡

期待 2 月，DeepSeek 给我们带来更大的惊喜✨

好，今天分享就是这些了～

最新文章

热门文章

随机文章

代码泄密!DeepSeek一周年,新模型“MODEL1”曝光

今天在检索信息的过程中，突然看到这个新闻，瞬间有了精神：

2025年1月，DeepSeek-R1上线，此时正值R1模型发布一周年之际，DeepSeek新模型“MODEL1”曝光。

二、新模型能力业界推测

基于代码细节，现在普遍有两个的推测：

第一，它可能是一个极致高效的推理模型。相比 V3.2，它的内存占用更低。这意味着它非常适合边缘设备，或者那些对成本极其敏感的场景。

第二，它可能是一个“长序列专家”。针对 16K+ 序列进行了深度优化，非常适合文档理解、代码分析等长上下文任务。

同样重要的消息，差不多两周前的1月9日，外媒就援引知情人士消息称：DeepSeek 将于 2月中旬，也就是春节前后发布其下一代模型。

重点是主打编程能力。据说在内部测试中，已经在多个基准上超越了 Claude 与 GPT 系列。

看来，春节大家又不能好好休息了，准备迎接“深水炸弹”吧！🧨

三、海外评价DeepSeek一周年

四、蔚公子的洞察

最后，我想聊聊 DeepSeek 这家公司给我的感觉。

首先，他们有自己的“时钟”。纵观 DeepSeek 一年以来的动向，你会发现，他们并没有完全被外界的声音打扰，而是一直有着自己的行动日程。外面吵翻天，他们只管写代码。

其次，你是质疑者，我是解题人。每当业界对其有所质疑，或有一些通用性的瓶颈问题发生时，他们总能给出自己的解决方案。

尤其是近期的几个更新以及论文的产出，都刚好对应当时AI圈内比较重大的议题，但巧合度实在是有点高🥲

再者，潜龙在渊。有意思的是，在研究 AI 的过程中，他们量化的成绩同样亮眼。在一边分心做量化的情况下数据依然能打，这说明什么？说明他们可能还未尽全力。

最后，必须点赞的是他们始终是用自有资金来参与这一轮的 AI 竞争。不烧投资人的钱，每一分都花在刀刃上，却依然能屡屡在榜单上杀出重围。

这种纯粹和实力，值得我们每一个创业者瑞思拜。🫡

期待 2 月，DeepSeek 给我们带来更大的惊喜✨

好，今天分享就是这些了～

爆火澳洲牧羊大叔:5行代码掀翻AI编程圈

0代码平台盘点:2026低成本的小程序工具平台精选合集

最新文章

热门文章

随机文章