gpt-5-2 - ByteSpike

gpt-5-2 夹在 gpt-5-4-mini 和 gpt-5-4 之间。它是最便宜的自带 web search 的 GPT-5 变体，也是 OpenAI 在”答之前先查一下”的短到中长 agent 循环中的偏好选择。如果用不上浏览，闭卷任务上 gpt-5-4-mini 同质量更便宜。如果要旗舰级推理余量，直接上 gpt-5-4。 价格： 输入

1.75 / 1M，输出

14.00 / 1M，缓存读取 $0.175 / 1M —— 见费率卡。

协议

协议	路径
OpenAI Chat Completions	`POST https://llm.bytespike.ai/v1/chat/completions`
OpenAI Responses	`POST https://llm.bytespike.ai/v1/responses`

快速开始

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-2",
    "messages": [
      { "role": "user", "content": "What is the current price of Bitcoin in USD?" }
    ],
    "tools": [{ "type": "web_search" }]
  }'

能力

能力	是否支持
Chat Completions	✅
Responses API	✅
流式（SSE）	✅
Vision	✅
Tool use（function calling）	✅ 并行
JSON mode	✅
结构化输出（json_schema）	✅
Reasoning effort	✅（`low` / `medium` / `high`）
Web search（内置工具）	✅
上下文窗口	128K tokens

什么时候用

一两跳浏览的短 agent 循环 —— 查市场价、查实时数据、给草稿做事实核查。同类活比 gpt-5-4 便宜。
Vision + 轻推理 —— 给图配文、OCR、“这张截图里有什么”，不需要旗舰级分析时。
中等量 RAG —— 检索做重活、LLM 负责摘要 / 综述时。

什么时候不用：

持续要 reasoning_effort: "high" 的硬推理 —— 加钱上 gpt-5-4 或 gpt-5-5。
高吞吐分类 / 路由 —— gpt-5-4-mini 才是正确档位。

下一步

gpt-5-4 —— 生产主力，无内置 web search 但推理更强
gpt-5-4-mini —— 更便宜，闭卷
端点类型 —— Chat Completions vs Responses

claude-haiku-4-5 gpt-5-4-nano

​协议

​快速开始

​能力

​什么时候用

​下一步

协议

快速开始

能力

什么时候用

下一步