跳转到主要内容
厂商: OpenAI Model ID: gpt-5-mini 能力: 128K 上下文 · 工具调用 · 视觉 · 流式 · 结构化输出 计价: 按 token,mini 档(实时费率 GPT-5-mini 是新生产工作中接替 GPT-4o-mini 的小模型。同一价位档,可量化地更紧的 结构化输出,更好的 tool-call 参数生成。对大多数抽取和路由流程来说,这是起点 —— 只在你跑过基准、确认 mini 的质量平台是瓶颈之后,才升级到 5 系列的标准模型。

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-mini",
    "messages": [
      {"role": "user", "content": "Extract the dates from: The deal closes 2024-08-12 with backup date 2024-09-01."}
    ],
    "response_format": {"type": "json_object"}
  }'

Body 参数

字段类型必填默认说明
modelstringgpt-5-mini
messagesarrayOpenAI chat 结构。
max_tokensinteger模型上限最大值:16384。
temperaturenumber1.0范围 0.0–2.0。
toolsarray支持 function calling(并行)。
tool_choicestring | object"auto"
response_formatobjectJSON 模式 + 结构化输出(抽取任务推荐)。
streambooleanfalseSSE 流式。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "gpt-5-mini",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "{\"dates\": [\"2024-08-12\", \"2024-09-01\"]}"}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 32, "completion_tokens": 18, "total_tokens": 50}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-mini",
    "messages": [{"role": "user", "content": "Extract the dates as JSON."}],
    "response_format": {"type": "json_object"}
  }'

流式与缓存

"stream": true 走 SSE。自动 prompt caching —— 保持 system prompt 与工具 schema 稳定以获取最高缓存命中率。

Errors

Code触发条件是否计费
400Body 校验
401key 缺失 / 已吊销
402钱包余额不足
422参数不支持
429触发限流
5xx上游问题

何时选用

  • 生产抽取 / 结构化输出 / 路由。
  • 轻量 agent 步骤(每步一次工具调用)。
  • 想要更高质量,见 GPT-5.5GPT-5.4
  • 想要更低延迟,见 GPT-5-nano
  • 5.4 时代的 mini,见 GPT-5.4-mini

限制

上下文窗口128K tokens
最大输出16384 tokens
支持工具调用是(并行)
支持视觉
支持流式
支持 prompt caching自动
支持结构化输出