跳转到主要内容
厂商: DeepSeek Model ID: deepseek-v4-pro 能力: 64K context · tool use · streaming · structured output · reasoning 价格: 按 token,pro 档(实时价格 DeepSeek V4 Pro 是开源权重档中代码生成任务的标杆。当问题结构化 —— 明确定义算法的实现、约束清晰的重构、代码库风格的迁移 —— 而且答案 要么能编要么不能时,伸手抓它。对更自由的任务(架构设计、散文、多 步规划),GPT-5.5 和 Claude Opus 4.8 仍有优势。

请求

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [{"role": "user", "content": "Implement a thread-safe LRU cache in Rust."}]
  }'

Body 参数

字段类型是否必填默认说明
modelstringdeepseek-v4-pro
messagesarray
max_tokensintegermodel max最大:16384。
temperaturenumber1.0
toolsarray支持 function calling(并行)。
response_formatobjectJSON / 结构化输出。
reasoningobject可选 reasoning chain —— 设 {"enabled": true} 启用。
streambooleanfalseSSE 流式。

响应

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "deepseek-v4-pro",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "use std::sync::..."}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 32, "completion_tokens": 1248, "total_tokens": 1280}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "deepseek-v4-pro", "messages": [{"role": "user", "content": "Implement a thread-safe LRU cache in Rust."}]}'

流式 + 缓存

"stream": true 走 SSE。稳定前缀自动 prompt caching。

错误

Code触发是否计费
400 / 401 / 402 / 422 / 429标准
5xx上游否(自动重试)

何时使用

  • 在明确定义语言中的结构化代码生成。
  • 算法实现、约束严格的重构。
  • 更低延迟,见 DeepSeek V4 Flash
  • 代码以外的多步规划,见 GPT-5.5Claude Opus 4.8

限制

限制
Context window64K tokens
Max output16384 tokens
支持 tool use是(并行)
支持 vision
支持 streaming
支持 prompt caching自动
支持 reasoning chain