多模态 - ByteSpike

ByteSpike 把每种模态都当作文本的平级 —— 同一个鉴权头、同一个钱包、同一组响应头。请求的形状按家族不同（图像用 /images/generations、视频用 /tasks/submit 等），但鉴权和计费表面是统一的。

家族总览

家族	同步？	关键端点
文本	是（可选流式）	`/v1/messages`、`/v1/chat/completions`、`/v1/responses`、`/v1beta/models/{model}:generateContent`
图像（同步）	是（≤30s）	`/v1/images/generations`、`/v1/images/edits`
图像 / 视频（异步）	否，异步	`POST /v1/tasks/submit` → 轮询 `/v1/tasks/query`（或 SSE `/v1/tasks/stream/:id`）
工具	是（免费）	`/v1/models`、`/v1/usage`、`/v1/balance`、`/v1/tasks/{query,cancel}`

为什么视频走异步

视频生成通常要 30–180 秒的 GPU 时间。把 HTTP 连接挂这么久很脆弱（proxy 超时、重试加倍成本）。异步模式是：

POST /v1/tasks/submit → 立即返回 task_id + estimated_credits + estimated_seconds
用 {"task_id": "..."} 轮询 POST /v1/tasks/query（免费），频率配合 ETA；或者通过 SSE 流式 GET /v1/tasks/stream/{task_id} 接收推送；或者 submit 时注册 callback_url，完全免轮询
当 status == "completed" 时，output 数组里是结果 URL

状态转移：pending → running → completed（成功路径）、 pending → running → failed（不计费），或者 pending|running → cancelled（手动取消，计费看该模型的退款策略）。

同一应用里混用模态

每把 API key 在 ByteSpike 上绑定到一个路由分组，分组决定它能触达哪些模型。对横跨多个模型家族的应用，按分组分别建 key：

# 绑到 Claude 分组的 key —— 触达 Claude + （经翻译）DeepSeek-Anthropic + 跨协议翻译过来的 Gemini
curl https://llm.bytespike.ai/api/v1/keys -H "x-api-key: $ADMIN_KEY" -d '{
  "name": "vision-claude-prod",
  "group_id": 1
}'

# 绑到 Gemini 分组的 key —— 触达 Gemini 原生 + 该分组里的图像/视频模型
curl https://llm.bytespike.ai/api/v1/keys -H "x-api-key: $ADMIN_KEY" -d '{
  "name": "vision-gemini-prod",
  "group_id": 3
}'

你账号可用的分组列表在 GET /api/v1/groups/available 或 console 的 创建 key 对话框里。要按流水线归因花费，调 GET /api/v1/usage 并按 api_key_id 过滤。

Credits 与账单流式

​家族总览

​为什么视频走异步

​同一应用里混用模态

家族总览

为什么视频走异步

同一应用里混用模态