跳转到主要内容
厂商: OpenAI Model ID: gpt-5-4 能力: 128K 上下文 · 工具调用 · 视觉 · 流式 · 结构化输出 计价: 按 token,标准档(实时费率 GPT-5.4 是 5.4 这波的主力 —— 相对 5.2,更好的 tool-call 参数生成、更紧的结构化 输出,同样的 128K 上下文。对于需要超越 mini 质量、又不想付 5.5 延迟代价的团队, 这就是生产默认款。多步推理见 GPT-5.4-pro

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-4",
    "messages": [{"role": "user", "content": "Refactor this React component to use hooks."}]
  }'

Body 参数

字段类型必填默认说明
modelstringgpt-5-4
messagesarray
max_tokensinteger模型上限最大值:16384。
temperaturenumber1.0
toolsarray并行 function calling。
response_formatobjectJSON / 结构化输出。
streambooleanfalseSSE 流式。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "gpt-5-4",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "..."}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 412, "completion_tokens": 587, "total_tokens": 999}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "gpt-5-4", "messages": [{"role": "user", "content": "Refactor this React component."}]}'

流式与缓存

"stream": true 走 SSE。重复前缀自动 prompt caching —— 在长 system prompt 上 省得最多。

Errors

Code触发条件是否计费
400 / 401 / 402 / 422 / 429标准
5xx上游否(自动重试)

何时选用

  • 代码生成、内容改写、工具使用类 agent 的生产默认款。
  • 多步推理场景,每一步都会放大效应,见 GPT-5.4-pro
  • 最新旗舰,见 GPT-5.5
  • 想要更低成本,见 GPT-5.4-mini
  • 上一档稍老的中端,见 GPT-5.2

限制

上下文窗口128K tokens
最大输出16384 tokens
支持工具调用是(并行)
支持视觉
支持流式
支持 prompt caching自动