跳转到主要内容
ByteSpike 是一个多模型网关,原生协议是 Anthropic Messages,同时透明兼容 OpenAI Chat CompletionsOpenAI ResponsesGemini Native。 一个 key 即可访问 text、image、video 全部端点 —— 计费用透明的 credits,无需 为各家厂商单独对接 SKU。

快速开始

两分钟内发出第一个请求。

鉴权

API key、分组绑定、速率限制如何工作。

API 参考

23 个端点,一个 base URL,一个鉴权头。

价格

按 token / 按次计费,无加价分层。

为什么选 ByteSpike

  • 默认兼容 Anthropic 协议 —— 你的 tool_usecache_controlthinking 块都能直接用。同一套 SDK、同一套重试语义,覆盖所有模型。
  • 一个 key 跑通多模态 —— text、image、video 全在一起,无需自己拼装多家厂商的账单。
  • 失败不计费 —— 所有非 2xx 响应免费。响应头会回传估算 credits,让你在向用户确认之前就能预览成本。
  • 逐 key 控制 —— 每个 API key 都有自己的配额(USD)、速率限制窗口(5h / 1d / 7d)、IP 白名单/黑名单,可选过期时间。组织钱包跨 key 汇总结算。

网关背后是什么

三套协议层、完整的多模态目录、几个工具端点 —— 全部从 llm.bytespike.ai 提供:
家族端点
文本POST /v1/messages(Anthropic)、POST /v1/chat/completions(OpenAI)、POST /v1/responses(OpenAI Responses)、POST /v1beta/models/{model}:generateContent(Gemini Native)
图像Seedream v4 / v4.5 / v5lite、GPT-Image-2(+ official + 4o-image)、Nano-Banana / Pro / v2
视频Sora-2 / 2-Pro、Veo-3.1 / 3.1-Fast、Seedance 1.5-Pro / Pro / Pro-Fast / Seedance2 / 2-Fast
工具GET /v1/models(列出目录)、GET /v1/usage(请求用量)、POST /v1/tasks/{submit,query,cancel}(异步多模态)、GET /v1/balance(免费)
完整目录和实时价格在 bytespike.ai/pricing。这份 文档专注讲解每个端点的请求结构、响应结构和注意事项。

Base URL

https://llm.bytespike.ai/v1
Anthropic SDK 把 baseURL 设成上面的值即可直接用。OpenAI SDK 同理 —— 各协议的 请求头布局见 鉴权