deepseek-v4-flash 是 DeepSeek V4 系列的中小档。$0.14 / 1M input 的价位低于 Haiku,同时支持 OpenAI Chat Completions 与 Anthropic Messages 两种形状 —— 在追求降本的高并发流水线里,它是常见的 gpt-5-4-mini 或 claude-haiku-4-5 替代品。
价格: 输入 0.28 / 1M,缓存读取 $0.003 / 1M —— 见费率卡。
Protocols
| Protocol | 路径 |
|---|---|
| Anthropic Messages | POST https://llm.bytespike.ai/v1/messages |
| OpenAI Chat Completions | POST https://llm.bytespike.ai/v1/chat/completions |
Quickstart
Capabilities
| 能力 | 支持 |
|---|---|
| Chat Completions | ✅ |
| Anthropic Messages | ✅ |
| Streaming (SSE) | ✅ |
| Tool use | ✅ |
| 并行工具调用 | — |
| JSON mode | ✅ |
| Reasoning chain | —(请用 deepseek-v4-pro) |
| Vision (HTTP API) | ❌ |
| 上下文窗口 | 64K tokens |
何时使用
- 高并发分类、路由、结构化抽取 —— 同时覆盖 OpenAI + Anthropic 协议的最便宜中文 LLM 档。
- 预算紧张的 agent 循环 ——
tool_use在 Anthropic 端点可用,价格接近 Haiku。 - 成本优化的兜底 —— 任务能装进 Flash 时,优先用这个 id,比
deepseek-v4-pro便宜约 3×。
- 需要 reasoning chain 的任务 —— 改用
deepseek-v4-pro。 - Vision 输入 —— HTTP API 目前不支持。
下一步
- deepseek-v4-pro —— 推理旗舰
- deepseek-v3.2 —— 老 V3 系列