ByteSpike 每种 surface 只发布一套逐模型费率。无分层、无加价说明。
失败的请求不计费。
1 USD = 1,000,000 credits(micro-USD 精度)。token 费率按每百万
token 报价。每次调用的费率按美元报价。
费率怎么算
本文档每一行都是该模型在 ByteSpike 的公开费率,每晚刷新。如果你需要
程序化访问同一份数据,直接打 GET /api/pricing(返回的 JSON 数组与
下面表格行一一对应)。
缓存定价约定:
- Cache write:大多数模型按 input 费率计费;Claude 模型按 1.25× input 计费。
- Cache read:一套独立、更低的逐模型费率 —— 因模型而异,见各行(并非全局统一 10%)。
- Web search 工具(支持的模型):按每千次使用单独计费的附加项。
订阅 / 充值价格见 bytespike.ai/pricing。
文本模型(25 款)
OpenAI(7 款)
| 模型 | Input / 1M | Cache write | Cache read | Output / 1M |
|---|
gpt-5-5 | $5.00 | $5.00 | $0.50 | $30.00 |
gpt-5-5-instant | $5.00 | $5.00 | $0.50 | $30.00 |
gpt-5-4-pro | $30.00 | $30.00 | $3.00 | $180.00 |
gpt-5-4 | $2.50 | $2.50 | $0.25 | $15.00 |
gpt-5-4-mini | $0.75 | $0.75 | $0.075 | $4.50 |
gpt-5-4-nano | $0.20 | $0.20 | $0.02 | $1.25 |
gpt-5-2 | $1.75 | $1.75 | $0.175 | $14.00 |
GPT-5.5 web-search 工具:$10 / 1k 次(单独计费)。
Anthropic(7 款)
| 模型 | Input / 1M | Cache write(1.25×) | Cache read | Output / 1M |
|---|
claude-opus-4-8 | $5.00 | $6.25 | $0.50 | $25.00 |
claude-opus-4-7 | $5.00 | $6.25 | $0.50 | $25.00 |
claude-opus-4-6 | $5.00 | $6.25 | $0.50 | $25.00 |
claude-opus-4-5 | $5.00 | $6.25 | $0.50 | $25.00 |
claude-sonnet-4-6 | $3.00 | $3.75 | $0.30 | $15.00 |
claude-sonnet-4-5 | $3.00 | $3.75 | $0.30 | $15.00 |
claude-haiku-4-5 | $1.00 | $1.25 | $0.10 | $5.00 |
Claude Opus 4.8 web-search 工具:$10 / 1k 次(单独计费)。
Google(5 款)
| 模型 | Input / 1M | Cache write | Cache read | Output / 1M |
|---|
gemini-3-1-pro | $2.00 | $2.00 | $0.20 | $12.00 |
gemini-3-5-flash | $1.50 | $1.50 | $0.15 | $9.00 |
gemini-3-flash | $0.50 | $0.50 | $0.05 | $3.00 |
gemini-3-flash-lite | $0.25 | $0.25 | $0.025 | $1.50 |
gemini-2-5-flash | $0.50 | $0.50 | $0.05 | $3.00 |
国产 LLM(6 款)
DeepSeek(3 款)
| 模型 | Input / 1M | Cache read | Output / 1M |
|---|
deepseek-v3-2 | $0.14 | $0.003 | $0.28 |
deepseek-v4-flash | $0.14 | $0.003 | $0.28 |
deepseek-v4-pro | $0.435 | $0.004 | $0.87 |
Moonshot(1 款)
| 模型 | Input / 1M | Cache read | Output / 1M |
|---|
kimi-k2-6 | $0.95 | $0.16 | $4.00 |
Zhipu(1 款)
| 模型 | Input / 1M | Cache read | Output / 1M |
|---|
glm-5-1 | $1.40 | $0.26 | $4.40 |
MiniMax(1 款)
| 模型 | Input / 1M | Cache read | Output / 1M |
|---|
minimax-m2-7 | $0.26 | $0.06 | $1.20 |
图像模型(6 款)
同步端点。按生成的每张图计费。n>1 时每张图单独计费。
OpenAI(1 款)
Google(2 款)
| 模型 | 每图 |
|---|
nano-banana | $0.018 |
nano-banana-v2 | $0.022 |
ByteDance(3 款)
| 模型 | 每图 |
|---|
seedream-4 | $0.025 |
seedream-4-5 | $0.030 |
seedream-v5lite | $0.012 |
上表未列出的图像模型一律走**默认每图费率 0.134∗∗。供参考,更高档的Gemini图像模型按‘gemini−3−pro−image‘0.134、gemini-3.1-flash-image
$0.335 每图计费。
视频模型(9 款)
走异步 /tasks/submit → /tasks/query。纯按输出秒数计费 —— 没有提交费。
queued 状态下取消免费;进入 running 后取消按已渲染的秒数部分计费。
OpenAI(2 款)
| 模型 | 分辨率 | 每秒 |
|---|
sora2 | 1080p | $0.10 |
sora2-pro | 1080p | $0.30 |
Google(2 款)
| 模型 | 分辨率 | 每秒 |
|---|
veo3-1 | 1080p | $0.40 |
veo3-1-fast | 720p | $0.20 |
ByteDance(5 款)
| 模型 | 分辨率 | 每秒 |
|---|
seedance-1-5-pro | 1080p | $0.05 |
seedance-pro | 1080p | $0.06 |
seedance-pro-fast | 1080p | $0.04 |
seedance2 | 1080p | $0.08 |
seedance2-fast | 720p | $0.05 |
工具端点
| 端点 | 成本 |
|---|
GET /balance | 免费 |
POST /tasks/submit | 成本 = 底层模型费率 × 时长 |
GET /tasks/query | 免费 |
POST /tasks/cancel | status=queued 时免费;running 时按比例计费 |
价格说明
- 失败不计费。 任何非 2xx 响应都免费。唯一的例外:视频任务在
running 之后被取消 —— 已消耗的 GPU 秒数会计费。
- Cache write 费率:大多数模型按 input 费率计 cache write。
Claude 模型按 1.25× input 计 cache write。
- Cache read 费率:一套独立、更低的逐模型费率 —— 因模型
而异,见各行(并非全局统一 10%)。
- Web search / grounding 工具(支持的模型):按每千次使用
单独计费,与 token 用量分开计。
- 图像 / 视频任务失败:任务级别 100% 退款。
- Chat 5xx:不计费;网关在最外层做了自动重试。
程序化访问
curl https://llm.bytespike.ai/api/pricing \
-H "x-api-key: $BYTESPIKE_API_KEY"
返回一个 JSON 数组,每款模型一项:
{
"model": "gpt-5-5",
"category": "text",
"vendor": "openai",
"rates": {
"input_per_1m": 5.00,
"cache_write_per_1m": 5.00,
"cache_read_per_1m": 0.50,
"output_per_1m": 30.00,
"currency": "USD"
},
"updated_at": "2026-05-08T04:30:00Z"
}
刷新频率为每天 UTC 04:30。客户端至少缓存 24 小时;updated_at 字段
告诉你该费率最近一次刷新的时间。