gpt-5-4-nano - ByteSpike

gpt-5-4-nano 是 GPT-5.4 家族的最小档 —— 在网关上拿到 GPT 风味推理的最便宜方式。当单位成本主导、且任务能塞进小 prompt 时，它是超高吞吐流量（分类、路由、短结构化抽取）的不二之选。 价格： 输入

0.20 / 1M，输出

1.25 / 1M，缓存读取 $0.02 / 1M —— 见费率卡。

协议

协议	路径
OpenAI Chat Completions	`POST https://llm.bytespike.ai/v1/chat/completions`
OpenAI Responses	`POST https://llm.bytespike.ai/v1/responses`

快速开始

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-4-nano",
    "reasoning_effort": "low",
    "messages": [
      { "role": "user", "content": "Classify: refund / billing / technical / other.\n\nMy invoice charged twice." }
    ]
  }'

能力

能力	是否支持
Chat Completions	✅
Responses API	✅
流式（SSE）	✅
Vision	✅
Tool use	✅ 并行
JSON mode	✅
结构化输出	✅
Reasoning effort	✅（`low` / `medium`）
Web search	—
上下文窗口	128K tokens

什么时候用

超高吞吐分类、路由、结构化抽取 —— 单位成本主导时最便宜的 GPT 档。
短 prompt agent 循环 —— 每步都很小、瓶颈在吞吐的 tool-use 链。
成本下限兜底 —— 任务塞得进 nano 时，相比 gpt-5-4-mini 优先选它以省成本。

什么时候不用：

受益于 reasoning_effort: "high" 的硬推理 —— 上 gpt-5-4 或 gpt-5-5。
需要 web search —— 只有 gpt-5-2 及以上才有。

下一步

gpt-5-4-mini —— GPT-5.4 家族的小中档
gpt-5-4 —— 生产主力

gpt-5-2 gpt-5-4-mini

​协议

​快速开始

​能力

​什么时候用

​下一步

协议

快速开始

能力

什么时候用

下一步