claude-opus-4-6
能力: 200K context · tool use · vision · prompt caching · streaming · extended thinking
价格: 按 token,Opus 档(实时价格)
Opus 4.6 是在 4.5 上的精修 —— 更紧致的长文散文,且在其 200K context
内跨多文档综合时幻觉有可测量的下降。它是 4.5 几乎够用、但还差点意思的
多文档工作流的正确 Opus:法律评审、科技文献综合、代码库审计报告。
Opus 4.8 是当前旗舰;
4.6 保留是给已经针对此特定版本验证过的团队。
请求
Body 参数
| 字段 | 类型 | 是否必填 | 默认 | 说明 |
|---|---|---|---|---|
model | string | 是 | — | claude-opus-4-6 |
messages | array | 是 | — | 对话历史。最多 200K token 输入。 |
max_tokens | integer | 是 | — | 硬上限。本模型最大:32768。 |
system | string | array | 否 | — | array 形式支持 cache_control。 |
temperature | number | 否 | 1.0 | 范围 0.0–1.0。 |
top_p | number | 否 | 1.0 | Nucleus sampling。 |
tools | array | 否 | — | 支持。 |
tool_choice | object | 否 | {"type":"auto"} | auto / any / tool(指定名)。 |
thinking | object | 否 | — | Extended-thinking 预算。 |
stream | boolean | 否 | false | SSE 流式。 |
响应
代码示例
Cache control
错误
| Code | 触发 | 是否计费 |
|---|---|---|
| 400 | Body 校验失败 | 否 |
| 401 | key 缺失 / 已撤销 | 否 |
| 402 | 钱包用尽 | 否 |
| 413 | 输入超过 200K token | 否 |
| 429 | 速率限制 | 否 |
| 5xx | 上游 provider 问题 | 否(自动重试信封) |
何时使用
- 4.5 几乎够用但还差点意思的多文档综合。
- 需要紧致、不重复散文的长文总结。
- 当前旗舰 Opus,见 Opus 4.8。
- 上一版 Opus,见 Opus 4.5。
- 中端成本 / 延迟,见 Sonnet 4.6。
限制
| 限制 | 值 |
|---|---|
| Context window | 200K tokens |
| Max output | 32768 tokens |
| 支持 tool use | 是 |
| 支持 vision | 是 |
| 支持 streaming | 是 |
| 支持 prompt caching | 是 |
| 支持 extended thinking | 是 |