模型评测

DeepSeek-V4 开源：原生 128K 上下文、推理与代码统一架构

# 开源模型# 推理# 评测

DeepSeek 团队发布 V4 系列并以宽松许可开源权重,主打“推理、代码、对话”三能力共享一套底座。相较上一代,V4 引入稀疏注意力 + 路由专家的混合结构,在 128K 上下文下把单次推理成本压到接近上一代 7B 模型的水平。社区最关心的两点是:其一,数学与代码评测相较 V3.2 提升明显;其二,开源协议允许商用与微调,带动私有部署与垂直行业适配。下一步值得关注的是蒸馏小模型与端侧推理的工程化。

作者

Open Model Lab

分类

模型 · 评测

发布时间

6月14日 07:10

收录时间

6月14日 02:59

原文链接

huggingface.co

Post ID

d3f9a2b6-3554-4da0-8dd8-6b4957053848