两个环境变量
Model id 映射
ByteSpike 原样使用 Anthropic 自己的 model id,外加经 Messages 结构 可达的非 Anthropic provider 的 id:| 你之前用的 Anthropic id | ByteSpike id(直接替换) |
|---|---|
claude-3-5-sonnet-20241022 | claude-sonnet-4-6(当前旗舰) |
claude-3-7-sonnet-20250219 | claude-sonnet-4-6 |
claude-sonnet-4-20250514 | claude-sonnet-4-6 |
claude-opus-4-20250514 | claude-opus-4-8 |
claude-3-5-haiku-20241022 | claude-haiku-4-5 |
| 跨厂商(经翻译走 Messages-API 结构) |
|---|
deepseek-v3-anthropic |
deepseek-v4-pro(翻译) |
gemini-3-1-pro(翻译 —— protocols_aggregate 里有 :translated 后缀) |
gpt-5-5(翻译 —— 工具结构还原度有限制) |
你能多拿到什么
| Anthropic 直连 | ByteSpike |
|---|---|
| 只有 Claude 系列 | Claude + 经 Messages 结构可达的跨厂商模型 |
| Anthropic 计费 | 一个 ByteSpike 钱包覆盖一切 |
| 套餐分层限速 | 单 key 限速(5h / 1d / 7d,全部可配) |
| 失败偶尔计费 | 失败一律不计费 |
| Prompt caching 原生 | Prompt caching 端到端保留 |
不变的东西
- Anthropic SDK —— Python、TypeScript,所有官方客户端
- Messages 结构 ——
messages、system、tools、tool_choice、max_tokens、stream,完全一致 - 工具调用 ——
input_schemaJSON Schema 格式、tool_use块、tool_result块 —— 完全一致 - Prompt caching ——
system/tools/ messages 上的cache_control块 —— 端到端保留 - 扩展思考 —— Opus / Sonnet 4.x 上的
thinking块 —— 保留 - 流式 —— SSE 用 Anthropic 事件名(
message_start/content_block_delta/ 等等) —— 逐字节兼容
具体例子
Messages
工具调用
claude-*、deepseek-v3-anthropic,以及翻译路径
(经 Messages 结构访问的 gemini-3-1-pro、gpt-5-5)效果一致。
Prompt caching
扩展思考(Opus / Sonnet 4.x)
需要再确认的点
单 key 的模型可用性
单 key 的模型可用性
在 key 上挑一个包含你想用的模型的路由分组。
claude-default
覆盖 Claude 系列。要跨厂商访问 Messages 结构的模型
(DeepSeek-Anthropic、Gemini 经翻译),挑包含这些的分组 ——
通常是多厂商分组,或者 org-tier 账号上的 default 分组。token 计数与价格
token 计数与价格
Claude 模型用 Anthropic 的 tokenizer —— 计数与 Anthropic 直连
一致。翻译路径(经 Messages 结构访问的 Gemini、GPT)按底层
模型的 token 费率计费,但计数方式跟随该模型 —— 可能有小差异。
Anthropic Workbench 独有的功能
Anthropic Workbench 独有的功能
ByteSpike 不复刻 Anthropic Workbench(prompt 开发的 Console UI)。
如果你的 prompt 开发依赖它,直连 Anthropic 做开发,再把 prompt
部署到 ByteSpike。
`anthropic-beta` 头
`anthropic-beta` 头
原样转发给模型。Anthropic 用这个头门禁的 beta 功能在 ByteSpike
上行为一致。
Message Batches API
Message Batches API
Anthropic 的
/v1/messages/batches 当前未在 ByteSpike 上
暴露。可排队的工作请用同步端点,或者我们的异步
/v1/tasks/* 流。分步操作
- 在 console.bytespike.ai 注册账号 —— 详见 注册账号。
- 充值 至少 $5 —— 详见 充值 credits。
- 在
claude-default(或多厂商分组)下创建一把 key。 - 设置环境变量 ——
ANTHROPIC_BASE_URL+ANTHROPIC_API_KEY—— 全局或者放.envrc。 - 原样跑已有脚本,确认 Claude 调用照旧能用。
- 逐个试跨厂商 id(
deepseek-v3-anthropic、gemini-3-1-pro)。 - 验证缓存保留 ——
usage.cache_read_input_tokens应该和 Anthropic 直连一样填上。
反向迁移
删掉两个环境变量,你就回到 Anthropic 直连。想 A/B 路由就把两份配置 都放秘钥管理器里。下一步
从 OpenAI 迁移
同样思路,OpenAI 那一边。
Claude Code CLI
CLI 端的具体配置。
/messages 参考
完整的 Messages-API 协议。
Endpoint 类型
跨协议翻译背后的工作原理。