gemini-cli(以及构建在它之上的 CLI / IDE 扩展家族)讲
Gemini Native 协议 —— 用 query 参数鉴权(?key=...),打到
/v1beta/models/{model}:generateContent。ByteSpike 在
llm.bytespike.ai/v1beta 原样提供该协议。
前置条件
- 一个 ByteSpike 账号 + 一把绑到
gemini-default分组的 key (或任何能服务 Gemini 模型的分组)。详见 注册账号。 - 装好 Gemini CLI:
配置
Gemini CLI 一般读GEMINI_API_KEY,并允许通过环境变量或 flag 覆盖
base URL。
GOOGLE_API_BASE_URL);或者在包装脚本里用下一节的
raw curl 形式。
验证
candidates[0].content.parts[0].text
字段,外加标准的 X-Quota-Remaining-Credits 响应头。
切换模型
模型名写在 URL 路径里:/v1beta 参考。
流式
把方法后缀换一下:data: {chunk}\n\n 块,以最后一个
[DONE] 标记结尾。
SDK
Google 官方 Generative AI SDK 和大多数第三方 Gemini 客户端都允许在 构造时覆盖baseUrl:
走 Gemini 栈的图像 + 视频模型
Veo(Google 的视频模型)出在 Gemini API 这套接口下,但 long-running 结构走的是 ByteSpike 的异步 tasks API:POST /tasks/submit 和
Veo 3.1 模型页。
排错
| 症状 | 原因 | 处理 |
|---|---|---|
401 API key not valid | key 错了或者缺 query 参数 | 确认 ?key=sk-byts-... 写对了且没漏 |
403 PERMISSION_DENIED | 模型不在 key 的分组里 | 换到 gemini-default 分组或选别的模型 |
404 NOT_FOUND(模型) | model id 拼错 —— ByteSpike 用短横线形式(gemini-3-1-pro),不是 Google 的点分形式(gemini-3.1-pro) | 用 /api/v1/me/available-models 里返回的 slug |
| 流式打完第一块就断 | 部分 CLI 默认打非流式端点;检查 :streamGenerateContent 后缀 | 切到 streamGenerateContent |
下一步
/v1beta 参考
完整请求 / 响应 / 流式协议。
Gemini 模型
模型、能力、价格。
Claude Code CLI
Anthropic 原生那一侧的对等品。
Cursor IDE
编辑器层的 Gemini 集成。