跳转到主要内容
claude-opus-4-7 是 ByteSpike 上的上一代 Opus,现已被 claude-opus-4-8 取代为 Claude 旗舰。在它的 200K token 上下文窗口内,它仍是深度推理、长文档 QA、多文档综述的有力选择。定价就是标准 Opus 费率。 价格: 输入 5.00/1M,输出5.00 / 1M,输出 25.00 / 1M,缓存读取 $0.50 / 1M,缓存写入为输入的 1.25× —— 见费率卡

协议

协议路径
Anthropic MessagesPOST https://llm.bytespike.ai/v1/messages
OpenAI Chat Completions(shim)POST https://llm.bytespike.ai/v1/chat/completions

快速开始

curl https://llm.bytespike.ai/v1/messages \
  -H "x-api-key: $BYTESPIKE_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-7",
    "max_tokens": 2048,
    "thinking": { "type": "enabled", "budget_tokens": 1024 },
    "messages": [
      { "role": "user", "content": "Untangle this contract." }
    ]
  }'

能力

能力是否支持
Chat completions
流式(SSE)
Vision(图像输入)
Tool use(function calling)✅ 并行
Prompt 缓存(cache_control)
Extended thinking
Web search(web_search 工具)
JSON / 结构化输出
上下文窗口200K tokens

什么时候用

  • 深度推理 —— 搭配 thinking: { enabled, budget_tokens: 1024+ } 拿到扩展思维链。
  • 长文档 QA —— 200K 以内的法律 / 合规文本和多文档综述。
  • Web search —— 需要新鲜事实的研究类查询。
什么时候用:
  • 新的旗舰级任务 —— claude-opus-4-8 是当前 Opus,已取代本模型。
  • 默认 chat —— claude-sonnet-4-6 在相同 200K 上下文下成本只有五分之一。
  • 高吞吐分类 —— claude-haiku-4-5 便宜 20 倍。

下一步