模型评测
DeepSeek-V4 开源:原生 128K 上下文、推理与代码统一架构
# 开源模型# 推理# 评测
DeepSeek 团队发布 V4 系列并以宽松许可开源权重,主打“推理、代码、对话”三能力共享一套底座。相较上一代,V4 引入稀疏注意力 + 路由专家的混合结构,在 128K 上下文下把单次推理成本压到接近上一代 7B 模型的水平。社区最关心的两点是:其一,数学与代码评测相较 V3.2 提升明显;其二,开源协议允许商用与微调,带动私有部署与垂直行业适配。下一步值得关注的是蒸馏小模型与端侧推理的工程化。
作者
Open Model Lab
分类
模型 · 评测
发布时间
6月14日 07:10
收录时间
6月14日 02:59
原文链接
Post ID
d3f9a2b6-3554-4da0-8dd8-6b4957053848