简介 - ByteSpike

ByteSpike 是一个多模型网关，原生协议是 Anthropic Messages，同时透明兼容 OpenAI Chat Completions、OpenAI Responses 和 Gemini Native。一个 key 即可访问 text、image、video 全部端点 —— 计费用透明的 credits，无需为各家厂商单独对接 SKU。

快速开始

两分钟内发出第一个请求。

鉴权

API key、分组绑定、速率限制如何工作。

API 参考

23 个端点，一个 base URL，一个鉴权头。

价格

按 token / 按次计费，无加价分层。

为什么选 ByteSpike

默认兼容 Anthropic 协议 —— 你的 tool_use、cache_control、thinking 块都能直接用。同一套 SDK、同一套重试语义，覆盖所有模型。
一个 key 跑通多模态 —— text、image、video 全在一起，无需自己拼装多家厂商的账单。
失败不计费 —— 所有非 2xx 响应免费。响应头会回传估算 credits，让你在向用户确认之前就能预览成本。
逐 key 控制 —— 每个 API key 都有自己的配额（USD）、速率限制窗口（5h / 1d / 7d）、IP 白名单/黑名单，可选过期时间。组织钱包跨 key 汇总结算。

网关背后是什么

三套协议层、完整的多模态目录、几个工具端点 —— 全部从 llm.bytespike.ai 提供：

家族	端点
文本	`POST /v1/messages`（Anthropic）、`POST /v1/chat/completions`（OpenAI）、`POST /v1/responses`（OpenAI Responses）、`POST /v1beta/models/{model}:generateContent`（Gemini Native）
图像	Seedream v4 / v4.5 / v5lite、GPT-Image-2（+ official + 4o-image）、Nano-Banana / Pro / v2
视频	Sora-2 / 2-Pro、Veo-3.1 / 3.1-Fast、Seedance 1.5-Pro / Pro / Pro-Fast / Seedance2 / 2-Fast
工具	`GET /v1/models`（列出目录）、`GET /v1/usage`（请求用量）、`POST /v1/tasks/{submit,query,cancel}`（异步多模态）、`GET /v1/balance`（免费）

完整目录和实时价格在 bytespike.ai/pricing。这份文档专注讲解每个端点的请求结构、响应结构和注意事项。

Base URL

https://llm.bytespike.ai/v1

Anthropic SDK 把 baseURL 设成上面的值即可直接用。OpenAI SDK 同理 —— 各协议的请求头布局见鉴权。

快速开始

快速开始

鉴权

API 参考

价格

​为什么选 ByteSpike

​网关背后是什么

​Base URL

为什么选 ByteSpike

网关背后是什么

Base URL