跳转到主要内容
gpt-5-2 夹在 gpt-5-4-minigpt-5-4 之间。它是最便宜的自带 web search 的 GPT-5 变体,也是 OpenAI 在”答之前先查一下”的短到中长 agent 循环中的偏好选择。 如果用不上浏览,闭卷任务上 gpt-5-4-mini 同质量更便宜。如果要旗舰级推理余量,直接上 gpt-5-4 价格: 输入 1.75/1M,输出1.75 / 1M,输出 14.00 / 1M,缓存读取 $0.175 / 1M —— 见费率卡

协议

协议路径
OpenAI Chat CompletionsPOST https://llm.bytespike.ai/v1/chat/completions
OpenAI ResponsesPOST https://llm.bytespike.ai/v1/responses

快速开始

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-5-2",
    "messages": [
      { "role": "user", "content": "What is the current price of Bitcoin in USD?" }
    ],
    "tools": [{ "type": "web_search" }]
  }'

能力

能力是否支持
Chat Completions
Responses API
流式(SSE)
Vision
Tool use(function calling)✅ 并行
JSON mode
结构化输出(json_schema)
Reasoning effort✅(low / medium / high
Web search(内置工具)
上下文窗口128K tokens

什么时候用

  • 一两跳浏览的短 agent 循环 —— 查市场价、查实时数据、给草稿做事实核查。同类活比 gpt-5-4 便宜。
  • Vision + 轻推理 —— 给图配文、OCR、“这张截图里有什么”,不需要旗舰级分析时。
  • 中等量 RAG —— 检索做重活、LLM 负责摘要 / 综述时。
什么时候用:
  • 持续要 reasoning_effort: "high" 的硬推理 —— 加钱上 gpt-5-4gpt-5-5
  • 高吞吐分类 / 路由 —— gpt-5-4-mini 才是正确档位。

下一步

  • gpt-5-4 —— 生产主力,无内置 web search 但推理更强
  • gpt-5-4-mini —— 更便宜,闭卷
  • 端点类型 —— Chat Completions vs Responses