DeepSeek V4 预览版把百万上下文带入开源模型竞争

DeepSeek 发布 V4 预览版,并同步开放权重。相比单纯追求更高分数,这次发布更值得关注的是两个方向:百万上下文成为默认能力,以及模型开始围绕 agent 工作流做系统优化。

DeepSeek-V4-Pro 是主力模型,官方披露为 1.6T 总参数、49B 激活参数。DeepSeek 称它在 Agentic Coding、世界知识、数学、STEM 和代码评测中达到当前开源模型领先水平,并在部分指标上接近顶级闭源模型。更有意思的是,DeepSeek 明确提到 V4 已经成为公司内部员工使用的 agentic coding 模型,这说明它不只是 demo 型发布,而是在真实工程流程里接受检验。

DeepSeek-V4-Flash 则是更偏产品化和成本效率的版本,284B 总参数、13B 激活参数。它在简单 agent 任务上接近 V4-Pro,但在复杂任务上仍有差距。这个分层很重要,因为 agent 产品最终不是只看最强模型,而是要在响应速度、上下文长度、推理质量和 API 成本之间找到可规模化的组合。

这次最关键的基础设施信号,是 DeepSeek 把 1M 上下文作为官方服务标配。其背后是 token 维度压缩与 DSA 稀疏注意力机制,目标是在长上下文场景下降低计算和显存成本。对 agent 来说,长上下文不是简单的“塞更多资料”,而是让模型能处理更长项目历史、更完整代码库、更复杂文档和更持续的任务状态。

DeepSeek 还强调 V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 agent 产品做了适配优化。这透露出一个趋势:模型厂商开始把 agent 框架当成核心分发入口,而不是只服务聊天产品。未来模型能力的评估,也会越来越多发生在真实工具链里,而不是孤立的问答界面中。

API 已经同步上线,base_url 不变,模型名切换为 deepseek-v4-prodeepseek-v4-flash 即可调用。两个模型都支持 OpenAI ChatCompletions 与 Anthropic API,并支持非思考和思考模式。旧模型名 deepseek-chatdeepseek-reasoner 将在 2026 年 7 月 24 日停止使用,目前分别路由到 V4-Flash 的非思考和思考模式。

如果 V4 的实际体验能接近官方描述,它会让开源模型在 agent 应用里的竞争位置进一步前移。闭源模型仍可能在最复杂推理上保持领先,但当长上下文、开放权重和较低成本同时出现时,很多企业和开发者会重新计算“默认模型”的选择。

阅读原文

← 全部文章