deepseek-v4-pro 是 DeepSeek 的推理旗舰,也是 ByteSpike 上最具性价比的高能力模型。在多数 benchmark 上与 gpt-5-4 质量相当,价格却只有其一小部分,并且保留了 DeepSeek 原生支持的双协议入口。
价格: 输入 0.87 / 1M,缓存读取 $0.004 / 1M —— 见费率卡。
DeepSeek V4 与较老的 V3.2 是两个不同的系列 —— 价格点不同。V3.2 见 deepseek-v3-2。
Protocols
| Protocol | 路径 |
|---|---|
| Anthropic Messages | POST https://llm.bytespike.ai/v1/messages |
| OpenAI Chat Completions | POST https://llm.bytespike.ai/v1/chat/completions |
Quickstart
Capabilities
| 能力 | 支持 |
|---|---|
| Chat Completions | ✅ |
| Anthropic Messages | ✅ |
| Streaming (SSE) | ✅ |
| Tool use (function calling) | ✅ 并行 |
| JSON mode | ✅ |
| Reasoning chain | ✅(reasoning_content 字段 / thinking 块) |
| Vision (HTTP API) | ❌ |
| 上下文窗口 | 64K tokens |
- OpenAI 端点:choice 上的
reasoning_content字段。 - Anthropic 端点:
content[]中位于text块前的thinking块。
何时使用
- 成本敏感的推理任务 —— 平时会用
gpt-5-4,但希望成本只有它的一小部分。 - 预算紧张的 agent ——
tool_use块通过 Anthropic 端点透明透传;DOSIA Agent 大量使用此模型。 - DOSIA Agent 模式 —— 必须走 Anthropic Messages 端点。
- 需要 vision 的任务 —— HTTP API 目前不支持。
- Web 检索 —— DeepSeek 不暴露 grounding 工具。
- 长上下文 —— 这里上限 64K;要 200K 用
claude-opus-4-8,要 1M 用gemini-3-1-pro。
下一步
- deepseek-v4-flash —— 中小档
- deepseek-v3.2 —— 老 V3 系列