跳转到主要内容
厂商: Moonshot Model ID: kimi-k2-6 能力: 128K 上下文 · 工具调用 · 流式 · 结构化输出 · CJK 原生 计价: 按 token,中端档(实时费率 Kimi K2.6 是网关上新中文市场工作的推荐起点。原生 CJK prompt 理解(在成语和 文档版式上比非中文旗舰更敏锐)、128K 上下文窗口、更紧的 tool-call 参数生成。对长文档抽取、对中文语气有要求的 agent 流程,以及 CJK 重度摘要场景, 它就是默认款。

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "kimi-k2-6",
    "messages": [{"role": "user", "content": "用这本财报的内容回答:现金流量表的关键变化是什么?"}]
  }'

Body 参数

字段类型必填默认说明
modelstringkimi-k2-6
messagesarray原生支持 CJK。
max_tokensinteger模型上限最大值:16384。
toolsarray支持 function calling(并行)。
response_formatobjectJSON / 结构化输出。
streambooleanfalseSSE 流式。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "kimi-k2-6",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "..."}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 142850, "completion_tokens": 524, "total_tokens": 143374}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "kimi-k2-6", "messages": [{"role": "user", "content": "提取关键条款"}]}'

流式与缓存

"stream": true 走 SSE。自动 prompt caching —— 在长 prompt 上, 缓存命中是杠杆最高的成本优化。

Errors

Code触发条件是否计费
400 / 401 / 402 / 422 / 429标准
5xx上游否(自动重试)

何时选用

  • 新的中文市场项目 —— CJK 工作的默认起点。
  • 中 / 日 / 韩 的长文档抽取。
  • 旗舰价位下需要更大上下文(1M),见 Gemini 3.1 Pro
  • 中文开源权重替代品,见 GLM-5-1DeepSeek V4 Pro

限制

上下文窗口128K tokens
最大输出16384 tokens
支持工具调用是(并行)
支持视觉
支持流式
支持 prompt caching自动