跳转到主要内容
厂商: OpenAI Model ID: gpt-5-4-nano 能力: 128K 上下文 · 工具调用 · 视觉 · 流式 计价: 按 token,nano 档(实时费率 GPT-5.4-nano 是 5.4 这波模型的速度底线。与 GPT-5-nano 同样的 nano 档价位,但带 5.4 的更紧输出。在路由、分类和 pipeline 头部分流场景里 是合适的选择 —— 这些场景下每一毫秒都会被大量调用放大。

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-4-nano",
    "messages": [{"role": "user", "content": "Is this email spam? yes / no. Email: ..."}]
  }'

Body 参数

字段类型必填默认说明
modelstringgpt-5-4-nano
messagesarray
max_tokensinteger模型上限最大值:8192。
toolsarray支持 function calling。
response_formatobjectJSON 模式 + 结构化输出。
streambooleanfalseSSE 流式。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "gpt-5-4-nano",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "yes"}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 142, "completion_tokens": 1, "total_tokens": 143}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "gpt-5-4-nano", "messages": [{"role": "user", "content": "Is this email spam?"}]}'

流式与缓存

"stream": true 走 SSE。自动 prompt caching。

Errors

Code触发条件是否计费
400 / 401 / 402 / 422 / 429标准
5xx上游否(自动重试)

何时选用

  • agent pipeline 头部的路由 / 分类。
  • 上一代 5 系列 nano,见 GPT-5-nano
  • 想要更高能力,见 GPT-5.4-mini

限制

上下文窗口128K tokens
最大输出8192 tokens
支持工具调用
支持视觉
支持流式
支持 prompt caching自动