gpt-5-2 夹在 gpt-5-4-mini 和 gpt-5-4 之间。它是最便宜的自带 web search 的 GPT-5 变体,也是 OpenAI 在”答之前先查一下”的短到中长 agent 循环中的偏好选择。
如果用不上浏览,闭卷任务上 gpt-5-4-mini 同质量更便宜。如果要旗舰级推理余量,直接上 gpt-5-4。
价格: 输入 14.00 / 1M,缓存读取 $0.175 / 1M —— 见费率卡。
协议
| 协议 | 路径 |
|---|---|
| OpenAI Chat Completions | POST https://llm.bytespike.ai/v1/chat/completions |
| OpenAI Responses | POST https://llm.bytespike.ai/v1/responses |
快速开始
能力
| 能力 | 是否支持 |
|---|---|
| Chat Completions | ✅ |
| Responses API | ✅ |
| 流式(SSE) | ✅ |
| Vision | ✅ |
| Tool use(function calling) | ✅ 并行 |
| JSON mode | ✅ |
| 结构化输出(json_schema) | ✅ |
| Reasoning effort | ✅(low / medium / high) |
| Web search(内置工具) | ✅ |
| 上下文窗口 | 128K tokens |
什么时候用
- 一两跳浏览的短 agent 循环 —— 查市场价、查实时数据、给草稿做事实核查。同类活比
gpt-5-4便宜。 - Vision + 轻推理 —— 给图配文、OCR、“这张截图里有什么”,不需要旗舰级分析时。
- 中等量 RAG —— 检索做重活、LLM 负责摘要 / 综述时。
- 持续要
reasoning_effort: "high"的硬推理 —— 加钱上gpt-5-4或gpt-5-5。 - 高吞吐分类 / 路由 ——
gpt-5-4-mini才是正确档位。
下一步
- gpt-5-4 —— 生产主力,无内置 web search 但推理更强
- gpt-5-4-mini —— 更便宜,闭卷
- 端点类型 —— Chat Completions vs Responses