DeepSeek-R1周年献礼!神秘MODEL1 2月登场,代码生成实力飙升?
AI 概述
新闻
在DeepSeek-R1发布一周年之际,其下一代旗舰模型有新动态。据The Information消息,新模型(或为DeepSeek V4)最快今年2月中旬农历新年期间发布,预计代码生成实力更强。开发者在DeepSeek GitHub代码库更新中发现,FlashMLA代码库横跨114个文件有28处提及“MODEL1”代号,其架构与当前“

在 DeepSeek-R1 迎来发布一周年的重要时刻,有关 DeepSeek 下一代旗舰模型的蛛丝马迹正逐渐显现。根据 The Information 的最新消息,这款备受瞩目的新模型(或许就是 DeepSeek V4)最快可能在今年 2 月中旬,也就是农历新年期间,正式与公众见面,并预计将展现出更为强大的代码生成实力。
有开发者在 DeepSeek 的 GitHub 代码库中有了新发现:在更新的 FlashMLA 代码库里,横跨 114 个文件,竟有多达 28 处提到了一个名为“MODEL1”的神秘代号。深入探究代码逻辑后发现,“MODEL1”代表着一种与当前“V32”(即 DeepSeek-V3.2)截然不同的全新架构。两者在键值(KV)缓存的布局方式、稀疏性处理策略以及 FP8 数据格式的解码支持上均存在显著差异,这无疑暗示着新模型在内存优化和计算效率方面进行了深度的底层革新。
此前,DeepSeek 团队已相继发表了关于“优化残差连接(mHC)”以及受生物学启发的“AI 记忆模块(Engram)”等技术论文。业内人士普遍推测,这些最新的科研成果极有可能被融入到正在研发的“MODEL1”之中,为这款即将问世的新旗舰提供坚实的技术后盾。
以上关于DeepSeek-R1周年献礼!神秘MODEL1 2月登场,代码生成实力飙升?的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » DeepSeek-R1周年献礼!神秘MODEL1 2月登场,代码生成实力飙升?
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » DeepSeek-R1周年献礼!神秘MODEL1 2月登场,代码生成实力飙升?
微信
支付宝