跳转到主要内容
gpt-5-4-nano 是 GPT-5.4 家族的最小档 —— 在网关上拿到 GPT 风味推理的最便宜方式。当单位成本主导、且任务能塞进小 prompt 时,它是超高吞吐流量(分类、路由、短结构化抽取)的不二之选。 价格: 输入 0.20/1M,输出0.20 / 1M,输出 1.25 / 1M,缓存读取 $0.02 / 1M —— 见费率卡

协议

协议路径
OpenAI Chat CompletionsPOST https://llm.bytespike.ai/v1/chat/completions
OpenAI ResponsesPOST https://llm.bytespike.ai/v1/responses

快速开始

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-4-nano",
    "reasoning_effort": "low",
    "messages": [
      { "role": "user", "content": "Classify: refund / billing / technical / other.\n\nMy invoice charged twice." }
    ]
  }'

能力

能力是否支持
Chat Completions
Responses API
流式(SSE)
Vision
Tool use✅ 并行
JSON mode
结构化输出
Reasoning effort✅(low / medium
Web search
上下文窗口128K tokens

什么时候用

  • 超高吞吐分类、路由、结构化抽取 —— 单位成本主导时最便宜的 GPT 档。
  • 短 prompt agent 循环 —— 每步都很小、瓶颈在吞吐的 tool-use 链。
  • 成本下限兜底 —— 任务塞得进 nano 时,相比 gpt-5-4-mini 优先选它以省成本。
什么时候用:
  • 受益于 reasoning_effort: "high" 的硬推理 —— 上 gpt-5-4gpt-5-5
  • 需要 web search —— 只有 gpt-5-2 及以上才有。

下一步