POST /v1/messages。这一点没得商量:值得用的 agent 框架需要 tool_use block、cache_control block、thinking block 端到端透传,而 Anthropic 形状是唯一把这三者作为一等概念暴露出来的协议。
DOSIA Chat 模式是另一回事 —— 它跑在 OpenAI Chat Completions 上,覆盖 ByteSpike 上所有 chat 形状的模型。本页专谈 Agent 模式:今天能用什么、规划了什么、每个模型有哪些值得知道的点。
协议表面
DOSIA Agent 的请求落到https://llm.bytespike.ai/v1/messages,用标准 Anthropic 形状:
tool_use content block 在响应里回来;DOSIA 执行工具;下一轮把 tool_result block 发回去。标准的 Anthropic Messages agent 循环。
DOSIA 在 system prompt 和稳定上下文(workspace 树、最近编辑)上加的 cache_control: { type: "ephemeral" } 标记会透传到任意服务该请求的模型 —— 见下文 逐模型的 cache_control 说明。
Agent 模式能调哪些模型 [#which-models-agent-mode-can-target]
Agent 模式享受和其他请求一样的路由 —— 但协议把可选集合限定到 支持 Anthropic Messages 表面的模型。 今天的合格集合:| 模型家族 | 状态 | 备注 |
|---|---|---|
claude-haiku-4-5 / sonnet-4-5 / sonnet-4-6 / opus-4-7 / opus-4-8 | ✅ 已上线 | Anthropic 原生形状;一切都能用 |
deepseek-v4-pro / deepseek-v4-flash | ✅ 已上线 | 见下文 DeepSeek 注意事项 |
kimi-k2-6(anthropic-compat 别名) | ⏳ 已规划 | anthropic-compat 表面在进行中 |
| GLM(anthropic-compat 别名) | ⏳ 已规划 | 同上 |
| MiniMax(anthropic-compat 别名) | ⏳ 已规划 | 同 |
为 Agent 挑模型
给 DOSIA Agent 用户的一份观点性决策辅助:| 场景 | 选 | 为什么 |
|---|---|---|
| 默认 agent 工作、能力面广 | claude-sonnet-4-6 | Tool use + thinking + cache_control + web_search 全在一起 |
| 代码库规模的 agent(整个 repo 进上下文) | claude-opus-4-8 | 200K 上下文窗口,当前 Anthropic 旗舰 |
| 生产规模、成本优化的 agent | claude-haiku-4-5 | 含 tool use;不含 thinking,但大多数 agent 循环不需要 extended thinking |
| 中文工作负载、成本敏感 | deepseek-v4-pro | 比 Sonnet 便宜约 10×;带 reasoning chain |
| 中文、最便宜档 | deepseek-v4-flash | Haiku 级价格;Pro 能力的子集 |
逐模型的 cache_control [#cache_control-per-model]
cache_control: { type: "ephemeral" } 标记在不同模型上行为不同:
- Claude 模型 —— 一等支持。Cache write 是输入的 1.25×;cache read 是输入的约 10%。每次命中刷新 TTL。
- DeepSeek 模型 —— 尚不支持
cache_control。标记原样透传并被忽略。没有缓存收益,但也不报错。 - Kimi / GLM / MiniMax —— 当前同 DeepSeek。anthropic-compat 别名接受形状,但缓存尚未打通。
cache_control 标记 —— 被忽略时是免费的,某个模型一旦获得支持就自动激活。
DeepSeek 注意事项 [#deepseek-caveats]
DOSIA Agent 对deepseek-v4-pro / deepseek-v4-flash 当下完全支持,有三个注意点:
- 不支持
cache_control。 如上。 - DeepSeek API 上没有 vision。 DeepSeek 的模型不接受 API 上的图像输入(OpenAI 形状和 anthropic-compat 都不支持)。如果你的 Agent 要发
imagecontent block,把这部分请求路由到 Claude 或gpt-5-4模型;其余留在 DeepSeek。 thinkingblock 在 OpenAI endpoint 上以reasoning_content出现,但在 anthropic-compat endpoint 上以正经thinkingblock 出现。 DOSIA Agent 走 anthropic-compat 路径,所以你拿到原生形状;这个差别只有切协议时才重要。
失败模式
DOSIA Agent → ByteSpike 一条链上能出哪些错、各长什么样:| 现象 | 可能原因 | 去哪查 |
|---|---|---|
/v1/messages 上 404 | 模型名对 Agent 不合格(例如发了一个 GPT 模型) | 发 Claude / DeepSeek / 未来支持的模型。见上文合格性表。 |
| 422 “tool_use not supported” | 模型尚未提供 anthropic-compat 表面 | 切到 Claude 或 DeepSeek;查 覆盖矩阵 |
| 5xx | 该模型暂时不可用 | ByteSpike 在你 key 分组内自动重试。如果分组内全部不可用,网关把错误透出来。 |
流中 error 事件 | 响应在流中途被中止 | 零 credit 扣费(见 credits 与账单);DOSIA 会以 streaming-failure toast 给用户提示 |
配置 DOSIA Cloud Enterprise
给 DOSIA Cloud Enterprise 管理员搭权限模板用:Global edition 和 China edition 预设按区域预选了正确的 Agent 默认值。把每套预设映射到 Agent + Chat 默认值的表见 models 索引 DOSIA 推荐路径。下一步
- Endpoint 类型 —— 完整的协议地图
- Models 索引 —— 每个模型的文档,含 DOSIA 推荐路径表