deepseek-v4-pro - ByteSpike

deepseek-v4-pro 是 DeepSeek 的推理旗舰，也是 ByteSpike 上最具性价比的高能力模型。在多数 benchmark 上与 gpt-5-4 质量相当，价格却只有其一小部分，并且保留了 DeepSeek 原生支持的双协议入口。 价格： 输入

0.435 / 1M，输出

0.87 / 1M，缓存读取 $0.004 / 1M —— 见费率卡。 DeepSeek V4 与较老的 V3.2 是两个不同的系列 —— 价格点不同。V3.2 见 deepseek-v3-2。

Protocols

Protocol	路径
Anthropic Messages	`POST https://llm.bytespike.ai/v1/messages`
OpenAI Chat Completions	`POST https://llm.bytespike.ai/v1/chat/completions`

两个协议都是一等公民。同一把 ByteSpike key 在两边都能用；按你客户端讲的形状挑一个。

Quickstart

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      { "role": "user", "content": "Hello, ByteSpike." }
    ]
  }'

Capabilities

能力	支持
Chat Completions	✅
Anthropic Messages	✅
Streaming (SSE)	✅
Tool use (function calling)	✅ 并行
JSON mode	✅
Reasoning chain	✅（`reasoning_content` 字段 / `thinking` 块）
Vision (HTTP API)	❌
上下文窗口	64K tokens

Reasoning chain（“thinking 输出”）出现在：

OpenAI 端点：choice 上的 reasoning_content 字段。
Anthropic 端点：content[] 中位于 text 块前的 thinking 块。

Reasoning tokens 计入 output 计费。

何时使用

成本敏感的推理任务 —— 平时会用 gpt-5-4，但希望成本只有它的一小部分。
预算紧张的 agent —— tool_use 块通过 Anthropic 端点透明透传；DOSIA Agent 大量使用此模型。
DOSIA Agent 模式 —— 必须走 Anthropic Messages 端点。

不适用的场景：

需要 vision 的任务 —— HTTP API 目前不支持。
Web 检索 —— DeepSeek 不暴露 grounding 工具。
长上下文 —— 这里上限 64K；要 200K 用 claude-opus-4-8，要 1M 用 gemini-3-1-pro。

下一步

deepseek-v4-flash —— 中小档
deepseek-v3.2 —— 老 V3 系列

deepseek-v4-flash deepseek-r1

​Protocols

​Quickstart

​Capabilities

​何时使用

​下一步

Protocols

Quickstart

Capabilities

何时使用

下一步