跳转到主要内容
deepseek-v4-flash 是 DeepSeek V4 系列的中小档。$0.14 / 1M input 的价位低于 Haiku,同时支持 OpenAI Chat Completions 与 Anthropic Messages 两种形状 —— 在追求降本的高并发流水线里,它是常见的 gpt-5-4-miniclaude-haiku-4-5 替代品。 价格: 输入 0.14/1M,输出0.14 / 1M,输出 0.28 / 1M,缓存读取 $0.003 / 1M —— 见费率卡

Protocols

Protocol路径
Anthropic MessagesPOST https://llm.bytespike.ai/v1/messages
OpenAI Chat CompletionsPOST https://llm.bytespike.ai/v1/chat/completions

Quickstart

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      { "role": "user", "content": "Classify: refund / billing / technical / other.\n\nMy invoice charged twice." }
    ]
  }'

Capabilities

能力支持
Chat Completions
Anthropic Messages
Streaming (SSE)
Tool use
并行工具调用
JSON mode
Reasoning chain—(请用 deepseek-v4-pro
Vision (HTTP API)
上下文窗口64K tokens

何时使用

  • 高并发分类、路由、结构化抽取 —— 同时覆盖 OpenAI + Anthropic 协议的最便宜中文 LLM 档。
  • 预算紧张的 agent 循环 —— tool_use 在 Anthropic 端点可用,价格接近 Haiku。
  • 成本优化的兜底 —— 任务能装进 Flash 时,优先用这个 id,比 deepseek-v4-pro 便宜约 3×。
适用的场景:
  • 需要 reasoning chain 的任务 —— 改用 deepseek-v4-pro
  • Vision 输入 —— HTTP API 目前不支持。

下一步