跳转到主要内容
厂商: MiniMax Model ID: minimax-m2.5 能力: 128K 上下文 · 工具调用 · 流式 · CJK 原生 计价: 按 token,中端档(实时费率 MiniMax M2.5 是 MiniMax 的上一代生产模型。它凭借中文创意写作树立了口碑 —— 人物声音一致性、对话、叙事节奏 —— 在多数竞品语气会被压平的价位档里仍能保持 表现。对该细分场景,它仍可上生产。新一般用途项目优先选 MiniMax M2.7

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "minimax-m2.5",
    "messages": [{"role": "user", "content": "续写这段对话,保持角色性格。"}]
  }'

Body 参数

字段类型必填默认说明
modelstringminimax-m2.5
messagesarray原生支持 CJK。
max_tokensinteger模型上限最大值:8192。
temperaturenumber1.0创意写作在 1.0–1.3 区间表现更好。
toolsarray支持 function calling。
streambooleanfalseSSE 流式。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "minimax-m2.5",
  "choices": [{"index": 0, "message": {"role": "assistant", "content": "..."}, "finish_reason": "stop"}],
  "usage": {"prompt_tokens": 287, "completion_tokens": 612, "total_tokens": 899}
}

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "minimax-m2.5", "messages": [{"role": "user", "content": "续写对话"}]}'

流式与缓存

"stream": true 走 SSE。自动 prompt caching。

Errors

Code触发条件是否计费
400 / 401 / 402 / 422 / 429标准
5xx上游否(自动重试)

何时选用

  • 已针对这个版本验证过的现有创意写作流水线。
  • 新项目优先选 MiniMax M2.7
  • 中文通用旗舰,见 Kimi K2.6GLM-5.1

限制

上下文窗口128K tokens
最大输出8192 tokens
支持工具调用
支持视觉
支持流式
支持 prompt caching自动