gpt-5-mini
能力: 128K 上下文 · 工具调用 · 视觉 · 流式 · 结构化输出
计价: 按 token,mini 档(实时费率)
GPT-5-mini 是新生产工作中接替 GPT-4o-mini 的小模型。同一价位档,可量化地更紧的
结构化输出,更好的 tool-call 参数生成。对大多数抽取和路由流程来说,这是起点 ——
只在你跑过基准、确认 mini 的质量平台是瓶颈之后,才升级到 5 系列的标准模型。
Request
Body 参数
| 字段 | 类型 | 必填 | 默认 | 说明 |
|---|---|---|---|---|
model | string | 是 | — | gpt-5-mini |
messages | array | 是 | — | OpenAI chat 结构。 |
max_tokens | integer | 否 | 模型上限 | 最大值:16384。 |
temperature | number | 否 | 1.0 | 范围 0.0–2.0。 |
tools | array | 否 | — | 支持 function calling(并行)。 |
tool_choice | string | object | 否 | "auto" | — |
response_format | object | 否 | — | JSON 模式 + 结构化输出(抽取任务推荐)。 |
stream | boolean | 否 | false | SSE 流式。 |
Response
代码示例
流式与缓存
"stream": true 走 SSE。自动 prompt caching —— 保持 system prompt 与工具
schema 稳定以获取最高缓存命中率。
Errors
| Code | 触发条件 | 是否计费 |
|---|---|---|
| 400 | Body 校验 | 否 |
| 401 | key 缺失 / 已吊销 | 否 |
| 402 | 钱包余额不足 | 否 |
| 422 | 参数不支持 | 否 |
| 429 | 触发限流 | 否 |
| 5xx | 上游问题 | 否 |
何时选用
- 生产抽取 / 结构化输出 / 路由。
- 轻量 agent 步骤(每步一次工具调用)。
- 想要更高质量,见 GPT-5.5 或 GPT-5.4。
- 想要更低延迟,见 GPT-5-nano。
- 5.4 时代的 mini,见 GPT-5.4-mini。
限制
| 项 | 值 |
|---|---|
| 上下文窗口 | 128K tokens |
| 最大输出 | 16384 tokens |
| 支持工具调用 | 是(并行) |
| 支持视觉 | 是 |
| 支持流式 | 是 |
| 支持 prompt caching | 自动 |
| 支持结构化输出 | 是 |