跳转到主要内容
厂商: OpenAI Model ID: gpt-5-5-instant 能力: 128K 上下文 · 工具调用 · 视觉 · 流式 · 结构化输出 计价: 按 token,旗舰档(实时费率 GPT-5.5-instant 是把推理链省掉的 GPT-5.5 —— 模型直接从 prompt 跳到答案。在短 prompt 和不需要推理的任务上(抽取、结构化输出、短篇改写),它就是合适的选择: 在受控输入上拿到旗舰质量,亚秒级 TTFB。

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-5-instant",
    "messages": [{"role": "user", "content": "Rewrite this support response in a friendlier tone."}]
  }'

Body 参数

字段类型必填默认说明
modelstringgpt-5-5-instant
messagesarray
max_tokensinteger模型上限最大值:16384。
toolsarray并行 function calling。
response_formatobjectJSON / 结构化输出。
streambooleanfalseSSE 流式。
本变体 不接受 reasoning_effort —— 传入会返回 422。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "gpt-5-5-instant",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "..."}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 87, "completion_tokens": 142, "total_tokens": 229}
}
没有 reasoning_tokens 字段 —— 没有推理链。

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "gpt-5-5-instant", "messages": [{"role": "user", "content": "Rewrite this in a friendlier tone."}]}'

流式与缓存

"stream": true 走 SSE。多数 prompt 都能拿到亚秒级 TTFB —— 因为推理链被省掉了。 稳定前缀自动 prompt caching。

Errors

Code触发条件是否计费
400 / 401 / 402 / 429标准
422带了 reasoning_effort(需要推理请用 GPT-5.5
5xx上游否(自动重试)

何时选用

  • 推理是过度配置的延迟敏感界面。
  • 在受控输入上做短篇改写、抽取、结构化输出。
  • 需要更深的多步推理,请用带 reasoning_effortGPT-5.5
  • 延迟敏感、想要 mini 档成本,见 GPT-5.4-mini

限制

上下文窗口128K tokens
最大输出16384 tokens
支持工具调用是(并行)
支持视觉
支持流式
支持 prompt caching自动
支持 reasoning_effort