跳转到主要内容
deepseek-v4-pro 是 DeepSeek 的推理旗舰,也是 ByteSpike 上最具性价比的高能力模型。在多数 benchmark 上与 gpt-5-4 质量相当,价格却只有其一小部分,并且保留了 DeepSeek 原生支持的双协议入口。 价格: 输入 0.435/1M,输出0.435 / 1M,输出 0.87 / 1M,缓存读取 $0.004 / 1M —— 见费率卡 DeepSeek V4 与较老的 V3.2 是两个不同的系列 —— 价格点不同。V3.2 见 deepseek-v3-2

Protocols

Protocol路径
Anthropic MessagesPOST https://llm.bytespike.ai/v1/messages
OpenAI Chat CompletionsPOST https://llm.bytespike.ai/v1/chat/completions
两个协议都是一等公民。同一把 ByteSpike key 在两边都能用;按你客户端讲的形状挑一个。

Quickstart

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      { "role": "user", "content": "Hello, ByteSpike." }
    ]
  }'

Capabilities

能力支持
Chat Completions
Anthropic Messages
Streaming (SSE)
Tool use (function calling)✅ 并行
JSON mode
Reasoning chain✅(reasoning_content 字段 / thinking 块)
Vision (HTTP API)
上下文窗口64K tokens
Reasoning chain(“thinking 输出”)出现在:
  • OpenAI 端点:choice 上的 reasoning_content 字段。
  • Anthropic 端点:content[] 中位于 text 块前的 thinking 块。
Reasoning tokens 计入 output 计费。

何时使用

  • 成本敏感的推理任务 —— 平时会用 gpt-5-4,但希望成本只有它的一小部分。
  • 预算紧张的 agent —— tool_use 块通过 Anthropic 端点透明透传;DOSIA Agent 大量使用此模型。
  • DOSIA Agent 模式 —— 必须走 Anthropic Messages 端点。
适用的场景:
  • 需要 vision 的任务 —— HTTP API 目前不支持。
  • Web 检索 —— DeepSeek 不暴露 grounding 工具。
  • 长上下文 —— 这里上限 64K;要 200K 用 claude-opus-4-8,要 1M 用 gemini-3-1-pro

下一步