gpt-5-4-nano 是 GPT-5.4 家族的最小档 —— 在网关上拿到 GPT 风味推理的最便宜方式。当单位成本主导、且任务能塞进小 prompt 时,它是超高吞吐流量(分类、路由、短结构化抽取)的不二之选。
价格: 输入 1.25 / 1M,缓存读取 $0.02 / 1M —— 见费率卡。
协议
| 协议 | 路径 |
|---|---|
| OpenAI Chat Completions | POST https://llm.bytespike.ai/v1/chat/completions |
| OpenAI Responses | POST https://llm.bytespike.ai/v1/responses |
快速开始
能力
| 能力 | 是否支持 |
|---|---|
| Chat Completions | ✅ |
| Responses API | ✅ |
| 流式(SSE) | ✅ |
| Vision | ✅ |
| Tool use | ✅ 并行 |
| JSON mode | ✅ |
| 结构化输出 | ✅ |
| Reasoning effort | ✅(low / medium) |
| Web search | — |
| 上下文窗口 | 128K tokens |
什么时候用
- 超高吞吐分类、路由、结构化抽取 —— 单位成本主导时最便宜的 GPT 档。
- 短 prompt agent 循环 —— 每步都很小、瓶颈在吞吐的 tool-use 链。
- 成本下限兜底 —— 任务塞得进 nano 时,相比
gpt-5-4-mini优先选它以省成本。
- 受益于
reasoning_effort: "high"的硬推理 —— 上gpt-5-4或gpt-5-5。 - 需要 web search —— 只有
gpt-5-2及以上才有。
下一步
- gpt-5-4-mini —— GPT-5.4 家族的小中档
- gpt-5-4 —— 生产主力