跳转到主要内容
ByteSpike 每种 surface 只发布一套逐模型费率。无分层、无加价说明。 失败的请求不计费。
1 USD = 1,000,000 credits(micro-USD 精度)。token 费率按每百万 token 报价。每次调用的费率按美元报价。

费率怎么算

本文档每一行都是该模型在 ByteSpike 的公开费率,每晚刷新。如果你需要 程序化访问同一份数据,直接打 GET /api/pricing(返回的 JSON 数组与 下面表格行一一对应)。 缓存定价约定:
  • Cache write:大多数模型按 input 费率计费;Claude 模型按 1.25× input 计费。
  • Cache read:一套独立、更低的逐模型费率 —— 因模型而异,见各行(并非全局统一 10%)。
  • Web search 工具(支持的模型):按每千次使用单独计费的附加项。
订阅 / 充值价格见 bytespike.ai/pricing

文本模型(25 款)

OpenAI(7 款)

模型Input / 1MCache writeCache readOutput / 1M
gpt-5-5$5.00$5.00$0.50$30.00
gpt-5-5-instant$5.00$5.00$0.50$30.00
gpt-5-4-pro$30.00$30.00$3.00$180.00
gpt-5-4$2.50$2.50$0.25$15.00
gpt-5-4-mini$0.75$0.75$0.075$4.50
gpt-5-4-nano$0.20$0.20$0.02$1.25
gpt-5-2$1.75$1.75$0.175$14.00
GPT-5.5 web-search 工具:$10 / 1k 次(单独计费)。

Anthropic(7 款)

模型Input / 1MCache write(1.25×)Cache readOutput / 1M
claude-opus-4-8$5.00$6.25$0.50$25.00
claude-opus-4-7$5.00$6.25$0.50$25.00
claude-opus-4-6$5.00$6.25$0.50$25.00
claude-opus-4-5$5.00$6.25$0.50$25.00
claude-sonnet-4-6$3.00$3.75$0.30$15.00
claude-sonnet-4-5$3.00$3.75$0.30$15.00
claude-haiku-4-5$1.00$1.25$0.10$5.00
Claude Opus 4.8 web-search 工具:$10 / 1k 次(单独计费)。

Google(5 款)

模型Input / 1MCache writeCache readOutput / 1M
gemini-3-1-pro$2.00$2.00$0.20$12.00
gemini-3-5-flash$1.50$1.50$0.15$9.00
gemini-3-flash$0.50$0.50$0.05$3.00
gemini-3-flash-lite$0.25$0.25$0.025$1.50
gemini-2-5-flash$0.50$0.50$0.05$3.00

国产 LLM(6 款)

DeepSeek(3 款)

模型Input / 1MCache readOutput / 1M
deepseek-v3-2$0.14$0.003$0.28
deepseek-v4-flash$0.14$0.003$0.28
deepseek-v4-pro$0.435$0.004$0.87

Moonshot(1 款)

模型Input / 1MCache readOutput / 1M
kimi-k2-6$0.95$0.16$4.00

Zhipu(1 款)

模型Input / 1MCache readOutput / 1M
glm-5-1$1.40$0.26$4.40

MiniMax(1 款)

模型Input / 1MCache readOutput / 1M
minimax-m2-7$0.26$0.06$1.20

图像模型(6 款)

同步端点。按生成的每张图计费。n>1 时每张图单独计费。

OpenAI(1 款)

模型每图
gpt-image-2$0.08

Google(2 款)

模型每图
nano-banana$0.018
nano-banana-v2$0.022

ByteDance(3 款)

模型每图
seedream-4$0.025
seedream-4-5$0.030
seedream-v5lite$0.012
上表未列出的图像模型一律走**默认每图费率 0.134。供参考,更高档的Gemini图像模型按gemini3proimage0.134**。供参考,更高档的 Gemini 图像模型按 `gemini-3-pro-image` 0.134、gemini-3.1-flash-image $0.335 每图计费。

视频模型(9 款)

走异步 /tasks/submit/tasks/query。纯按输出秒数计费 —— 没有提交费。 queued 状态下取消免费;进入 running 后取消按已渲染的秒数部分计费。

OpenAI(2 款)

模型分辨率每秒
sora21080p$0.10
sora2-pro1080p$0.30

Google(2 款)

模型分辨率每秒
veo3-11080p$0.40
veo3-1-fast720p$0.20

ByteDance(5 款)

模型分辨率每秒
seedance-1-5-pro1080p$0.05
seedance-pro1080p$0.06
seedance-pro-fast1080p$0.04
seedance21080p$0.08
seedance2-fast720p$0.05

工具端点

端点成本
GET /balance免费
POST /tasks/submit成本 = 底层模型费率 × 时长
GET /tasks/query免费
POST /tasks/cancelstatus=queued 时免费;running 时按比例计费

价格说明

  • 失败不计费。 任何非 2xx 响应都免费。唯一的例外:视频任务在 running 之后被取消 —— 已消耗的 GPU 秒数会计费。
  • Cache write 费率:大多数模型按 input 费率计 cache write。 Claude 模型按 1.25× input 计 cache write。
  • Cache read 费率:一套独立、更低的逐模型费率 —— 因模型 而异,见各行(并非全局统一 10%)。
  • Web search / grounding 工具(支持的模型):按每千次使用 单独计费,与 token 用量分开计。
  • 图像 / 视频任务失败:任务级别 100% 退款。
  • Chat 5xx:不计费;网关在最外层做了自动重试。

程序化访问

curl https://llm.bytespike.ai/api/pricing \
  -H "x-api-key: $BYTESPIKE_API_KEY"
返回一个 JSON 数组,每款模型一项:
{
  "model": "gpt-5-5",
  "category": "text",
  "vendor": "openai",
  "rates": {
    "input_per_1m": 5.00,
    "cache_write_per_1m": 5.00,
    "cache_read_per_1m": 0.50,
    "output_per_1m": 30.00,
    "currency": "USD"
  },
  "updated_at": "2026-05-08T04:30:00Z"
}
刷新频率为每天 UTC 04:30。客户端至少缓存 24 小时;updated_at 字段 告诉你该费率最近一次刷新的时间。

另见