gpt-5-4-mini 是 GPT-5 的小中档。保留了 GPT-5 的推理能力,但按 token 成本大约只有 gpt-5-4 的三分之一。高吞吐流量想要好于 Haiku 的质量、又不愿付旗舰价时的默认选项。
价格: 输入 4.50 / 1M,缓存读取 $0.075 / 1M —— 见费率卡。
协议
| 协议 | 路径 |
|---|---|
| OpenAI Chat Completions | POST https://llm.bytespike.ai/v1/chat/completions |
| OpenAI Responses | POST https://llm.bytespike.ai/v1/responses |
快速开始
能力
| 能力 | 是否支持 |
|---|---|
| Chat Completions | ✅ |
| Responses API | ✅ |
| 流式(SSE) | ✅ |
| Vision | ✅ |
| Tool use | ✅ 并行 |
| JSON mode | ✅ |
| 结构化输出 | ✅ |
| Reasoning effort | ✅(low / medium) |
| Web search | — |
| 上下文窗口 | 128K tokens |
什么时候用
- 高吞吐分类、路由、结构化抽取 —— 任何为成本而想用 Haiku、但又想要 GPT 风味推理的场景。
- 短 prompt 的 agent 循环 —— 每步都不大、看重吞吐的 tool use 链。
- 更便宜的 Codex 风格 via Responses API,配
reasoning_effort: "low"。
- 需要
reasoning_effort: "high"才能受益的硬推理 —— 上gpt-5-4或gpt-5-4-pro。 - 需要 web search —— 只有
gpt-5-2及以上自带。
下一步
- gpt-5-4 —— 生产主力
- gpt-5-4-nano —— GPT-5.4 最小档