gpt-5-4-nano
能力: 128K 上下文 · 工具调用 · 视觉 · 流式
计价: 按 token,nano 档(实时费率)
GPT-5.4-nano 是 5.4 这波模型的速度底线。与 GPT-5-nano
同样的 nano 档价位,但带 5.4 的更紧输出。在路由、分类和 pipeline 头部分流场景里
是合适的选择 —— 这些场景下每一毫秒都会被大量调用放大。
Request
Body 参数
| 字段 | 类型 | 必填 | 默认 | 说明 |
|---|---|---|---|---|
model | string | 是 | — | gpt-5-4-nano |
messages | array | 是 | — | — |
max_tokens | integer | 否 | 模型上限 | 最大值:8192。 |
tools | array | 否 | — | 支持 function calling。 |
response_format | object | 否 | — | JSON 模式 + 结构化输出。 |
stream | boolean | 否 | false | SSE 流式。 |
Response
代码示例
流式与缓存
"stream": true 走 SSE。自动 prompt caching。
Errors
| Code | 触发条件 | 是否计费 |
|---|---|---|
| 400 / 401 / 402 / 422 / 429 | 标准 | 否 |
| 5xx | 上游 | 否(自动重试) |
何时选用
- agent pipeline 头部的路由 / 分类。
- 上一代 5 系列 nano,见 GPT-5-nano。
- 想要更高能力,见 GPT-5.4-mini。
限制
| 项 | 值 |
|---|---|
| 上下文窗口 | 128K tokens |
| 最大输出 | 8192 tokens |
| 支持工具调用 | 是 |
| 支持视觉 | 是 |
| 支持流式 | 是 |
| 支持 prompt caching | 自动 |