跳转到主要内容
DOSIA Agent 模式跑在 Anthropic Messages 协议 上 —— POST /v1/messages。这一点没得商量:值得用的 agent 框架需要 tool_use block、cache_control block、thinking block 端到端透传,而 Anthropic 形状是唯一把这三者作为一等概念暴露出来的协议。 DOSIA Chat 模式是另一回事 —— 它跑在 OpenAI Chat Completions 上,覆盖 ByteSpike 上所有 chat 形状的模型。本页专谈 Agent 模式:今天能用什么、规划了什么、每个模型有哪些值得知道的点。

协议表面

DOSIA Agent 的请求落到 https://llm.bytespike.ai/v1/messages,用标准 Anthropic 形状:
{
  "model": "claude-sonnet-4-6",
  "max_tokens": 2048,
  "tools": [
    {
      "name": "search_files",
      "description": "Search the local workspace for files.",
      "input_schema": { ... }
    }
  ],
  "messages": [
    { "role": "user", "content": "Find every place we set the locale cookie." }
  ]
}
tool_use content block 在响应里回来;DOSIA 执行工具;下一轮把 tool_result block 发回去。标准的 Anthropic Messages agent 循环。 DOSIA 在 system prompt 和稳定上下文(workspace 树、最近编辑)上加的 cache_control: { type: "ephemeral" } 标记会透传到任意服务该请求的模型 —— 见下文 逐模型的 cache_control 说明

Agent 模式能调哪些模型 [#which-models-agent-mode-can-target]

Agent 模式享受和其他请求一样的路由 —— 但协议把可选集合限定到 支持 Anthropic Messages 表面的模型 今天的合格集合:
模型家族状态备注
claude-haiku-4-5 / sonnet-4-5 / sonnet-4-6 / opus-4-7 / opus-4-8✅ 已上线Anthropic 原生形状;一切都能用
deepseek-v4-pro / deepseek-v4-flash✅ 已上线见下文 DeepSeek 注意事项
kimi-k2-6(anthropic-compat 别名)⏳ 已规划anthropic-compat 表面在进行中
GLM(anthropic-compat 别名)⏳ 已规划同上
MiniMax(anthropic-compat 别名)⏳ 已规划
GPT 和 Gemini 在此列 —— 它们不支持 Anthropic Messages 表面,ByteSpike 也不会去合成(在 agent 用途上协议映射的保真损失不值得)。GPT 或 Gemini 走 DOSIA Chat 模式 —— 见 Endpoint 类型

为 Agent 挑模型

给 DOSIA Agent 用户的一份观点性决策辅助:
场景为什么
默认 agent 工作、能力面广claude-sonnet-4-6Tool use + thinking + cache_control + web_search 全在一起
代码库规模的 agent(整个 repo 进上下文)claude-opus-4-8200K 上下文窗口,当前 Anthropic 旗舰
生产规模、成本优化的 agentclaude-haiku-4-5含 tool use;不含 thinking,但大多数 agent 循环不需要 extended thinking
中文工作负载、成本敏感deepseek-v4-pro比 Sonnet 便宜约 10×;带 reasoning chain
中文、最便宜档deepseek-v4-flashHaiku 级价格;Pro 能力的子集
models/index 的推荐路径表从模型视角覆盖了同一片土壤。

逐模型的 cache_control [#cache_control-per-model]

cache_control: { type: "ephemeral" } 标记在不同模型上行为不同:
  • Claude 模型 —— 一等支持。Cache write 是输入的 1.25×;cache read 是输入的约 10%。每次命中刷新 TTL。
  • DeepSeek 模型 —— 尚不支持 cache_control。标记原样透传并被忽略。没有缓存收益,但也不报错。
  • Kimi / GLM / MiniMax —— 当前同 DeepSeek。anthropic-compat 别名接受形状,但缓存尚未打通。
这是已知的限制。当前推荐:不管目标是哪个模型,都在你的 DOSIA Agent system prompt 里保留 cache_control 标记 —— 被忽略时是免费的,某个模型一旦获得支持就自动激活。

DeepSeek 注意事项 [#deepseek-caveats]

DOSIA Agent 对 deepseek-v4-pro / deepseek-v4-flash 当下完全支持,有三个注意点:
  1. 不支持 cache_control 如上。
  2. DeepSeek API 上没有 vision。 DeepSeek 的模型不接受 API 上的图像输入(OpenAI 形状和 anthropic-compat 都不支持)。如果你的 Agent 要发 image content block,把这部分请求路由到 Claude 或 gpt-5-4 模型;其余留在 DeepSeek。
  3. thinking block 在 OpenAI endpoint 上以 reasoning_content 出现,但在 anthropic-compat endpoint 上以正经 thinking block 出现。 DOSIA Agent 走 anthropic-compat 路径,所以你拿到原生形状;这个差别只有切协议时才重要。

失败模式

DOSIA Agent → ByteSpike 一条链上能出哪些错、各长什么样:
现象可能原因去哪查
/v1/messages 上 404模型名对 Agent 不合格(例如发了一个 GPT 模型)发 Claude / DeepSeek / 未来支持的模型。见上文合格性表。
422 “tool_use not supported”模型尚未提供 anthropic-compat 表面切到 Claude 或 DeepSeek;查 覆盖矩阵
5xx该模型暂时不可用ByteSpike 在你 key 分组内自动重试。如果分组内全部不可用,网关把错误透出来。
流中 error 事件响应在流中途被中止零 credit 扣费(见 credits 与账单);DOSIA 会以 streaming-failure toast 给用户提示
更全面的 failure-billing 策略见 credits 与账单。重试和幂等见 错误处理

配置 DOSIA Cloud Enterprise

给 DOSIA Cloud Enterprise 管理员搭权限模板用:Global editionChina edition 预设按区域预选了正确的 Agent 默认值。把每套预设映射到 Agent + Chat 默认值的表见 models 索引 DOSIA 推荐路径

下一步