跳转到主要内容
ByteSpike 把每种模态都当作文本的平级 —— 同一个鉴权头、同一个钱包、同一组响应头。 请求的形状按家族不同(图像用 /images/generations、视频用 /tasks/submit 等), 但鉴权和计费表面是统一的。

家族总览

家族同步?关键端点
文本是(可选流式)/v1/messages/v1/chat/completions/v1/responses/v1beta/models/{model}:generateContent
图像(同步)是(≤30s)/v1/images/generations/v1/images/edits
图像 / 视频(异步)否,异步POST /v1/tasks/submit → 轮询 /v1/tasks/query(或 SSE /v1/tasks/stream/:id
工具是(免费)/v1/models/v1/usage/v1/balance/v1/tasks/{query,cancel}

为什么视频走异步

视频生成通常要 30–180 秒的 GPU 时间。把 HTTP 连接挂这么久很脆弱(proxy 超时、重试加倍成本)。异步模式是:
  1. POST /v1/tasks/submit → 立即返回 task_id + estimated_credits + estimated_seconds
  2. {"task_id": "..."} 轮询 POST /v1/tasks/query(免费),频率配合 ETA;或者通过 SSE 流式 GET /v1/tasks/stream/{task_id} 接收推送;或者 submit 时注册 callback_url,完全免轮询
  3. status == "completed" 时,output 数组里是结果 URL
状态转移:pending → running → completed(成功路径)、 pending → running → failed(不计费),或者 pending|running → cancelled(手动取消,计费看该模型的退款策略)。

同一应用里混用模态

每把 API key 在 ByteSpike 上绑定到 一个 路由分组,分组决定它能触达哪些模型。对横跨多个模型家族的应用,按分组分别建 key:
# 绑到 Claude 分组的 key —— 触达 Claude + (经翻译)DeepSeek-Anthropic + 跨协议翻译过来的 Gemini
curl https://llm.bytespike.ai/api/v1/keys -H "x-api-key: $ADMIN_KEY" -d '{
  "name": "vision-claude-prod",
  "group_id": 1
}'

# 绑到 Gemini 分组的 key —— 触达 Gemini 原生 + 该分组里的图像/视频模型
curl https://llm.bytespike.ai/api/v1/keys -H "x-api-key: $ADMIN_KEY" -d '{
  "name": "vision-gemini-prod",
  "group_id": 3
}'
你账号可用的分组列表在 GET /api/v1/groups/available 或 console 的 创建 key 对话框里。要按流水线归因花费,调 GET /api/v1/usage 并按 api_key_id 过滤。