咨询热线

notice  网站公告

NEWS CENTER

极速VPN

service phone

DeepSeek新模型曝光:MODEL1代码预示新架构最快有望

发布时间:2026-04-01  点击量:
更多

  该标识符与已知的现有模型“V32”(即 DeepSeek-V3.2)被并列或区别提及。根据代码上下文分析,“MODEL1”很可能代表一个不同于现有架构的新模型。

  开发者分析认为,“MODEL1”与“V32”在关键技术上存在区别,主要体现在键值(KV)缓存的布局、稀疏性处理方式以及对 FP8 数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。

  此前,DeepSeek 研究团队还陆续发布了两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI 记忆模块(Engram)”。这一举动不禁引起用户猜测,DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。敬请期待。


有什么问题请反馈给我们!


如有需求请您联系我们!

地址:
电话:
邮箱:

ICP备案编号:
Copyright © 2026 翻墙梯子推荐_快连加速器全球高速稳定VPN