跳转到主要内容
gpt-5-4-mini 是 GPT-5 的小中档。保留了 GPT-5 的推理能力,但按 token 成本大约只有 gpt-5-4三分之一。高吞吐流量想要好于 Haiku 的质量、又不愿付旗舰价时的默认选项。 价格: 输入 0.75/1M,输出0.75 / 1M,输出 4.50 / 1M,缓存读取 $0.075 / 1M —— 见费率卡

协议

协议路径
OpenAI Chat CompletionsPOST https://llm.bytespike.ai/v1/chat/completions
OpenAI ResponsesPOST https://llm.bytespike.ai/v1/responses

快速开始

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-4-mini",
    "reasoning_effort": "low",
    "messages": [
      { "role": "user", "content": "Classify: refund / billing / technical / other.\n\nMy invoice charged twice." }
    ]
  }'

能力

能力是否支持
Chat Completions
Responses API
流式(SSE)
Vision
Tool use✅ 并行
JSON mode
结构化输出
Reasoning effort✅(low / medium
Web search
上下文窗口128K tokens

什么时候用

  • 高吞吐分类、路由、结构化抽取 —— 任何为成本而想用 Haiku、但又想要 GPT 风味推理的场景。
  • 短 prompt 的 agent 循环 —— 每步都不大、看重吞吐的 tool use 链。
  • 更便宜的 Codex 风格 via Responses API,配 reasoning_effort: "low"
什么时候用:
  • 需要 reasoning_effort: "high" 才能受益的硬推理 —— 上 gpt-5-4gpt-5-4-pro
  • 需要 web search —— 只有 gpt-5-2 及以上自带。

下一步