claude-opus-4-7 是 ByteSpike 上的上一代 Opus,现已被 claude-opus-4-8 取代为 Claude 旗舰。在它的 200K token 上下文窗口内,它仍是深度推理、长文档 QA、多文档综述的有力选择。定价就是标准 Opus 费率。
价格: 输入 25.00 / 1M,缓存读取 $0.50 / 1M,缓存写入为输入的 1.25× —— 见费率卡。
协议
| 协议 | 路径 |
|---|---|
| Anthropic Messages | POST https://llm.bytespike.ai/v1/messages |
| OpenAI Chat Completions(shim) | POST https://llm.bytespike.ai/v1/chat/completions |
快速开始
能力
| 能力 | 是否支持 |
|---|---|
| Chat completions | ✅ |
| 流式(SSE) | ✅ |
| Vision(图像输入) | ✅ |
| Tool use(function calling) | ✅ 并行 |
| Prompt 缓存(cache_control) | ✅ |
| Extended thinking | ✅ |
| Web search(web_search 工具) | ✅ |
| JSON / 结构化输出 | ✅ |
| 上下文窗口 | 200K tokens |
什么时候用
- 深度推理 —— 搭配
thinking: { enabled, budget_tokens: 1024+ }拿到扩展思维链。 - 长文档 QA —— 200K 以内的法律 / 合规文本和多文档综述。
- Web search —— 需要新鲜事实的研究类查询。
- 新的旗舰级任务 ——
claude-opus-4-8是当前 Opus,已取代本模型。 - 默认 chat ——
claude-sonnet-4-6在相同 200K 上下文下成本只有五分之一。 - 高吞吐分类 ——
claude-haiku-4-5便宜 20 倍。
下一步
- claude-opus-4-8 —— 当前 Opus 旗舰
- claude-sonnet-4-6 —— 生产中档
- claude-haiku-4-5 —— 小 + 便宜