跳转到主要内容
厂商: OpenAI Model ID: gpt-4o-image 能力: 1024² – 2048² · 多轮图像生成 · 会话内编辑 价格: 按张计费,会话级 (实时费率) GPT-4o Image 是会话式图像生成器 —— 不是一次性调用 /images/generations,而是发一个 chat completions 请求,模型在响应里 返回图像内容。在多轮工作流里这点关键:「生成这个」、「把背景改成蓝色」、 「现在加一只狗」。会话记忆保留了底层图像,所以后续轮次是编辑、不是 重新生成。

Request

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-4o-image",
    "messages": [
      {"role": "user", "content": "Generate an image of a koi pond at dusk."}
    ],
    "image_output": {"size": "1024x1024", "quality": "high"}
  }'

Body 参数

FieldTypeRequiredDefaultNotes
modelstringyesgpt-4o-image
messagesarrayyes标准 chat 结构。模型以 image_url 内容块返回图像。
image_output.sizestringno1024x1024支持:1024x10241024x15361536x10242048x2048
image_output.qualitystringno"medium""low" / "medium" / "high"
image_output.nintegerno1单轮 1–2 张。
toolsarrayno图像输出可与 function calling 并用。
streambooleannofalse支持流式的部分图像 delta。

Response

{
  "id": "chatcmpl-…",
  "object": "chat.completion",
  "model": "gpt-4o-image",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": [
        {"type": "text", "text": "Here's the koi pond at dusk:"},
        {"type": "image_url", "image_url": {"url": "https://cdn.bytespike.ai/img/..."}}
      ]
    },
    "finish_reason": "stop"
  }],
  "usage": {"prompt_tokens": 18, "completion_tokens": 14, "image_tokens": 1024, "total_tokens": 1056}
}
URL 预签名,24h 有效。把对话回传到 messages 即可在后续轮次编辑同一张图。

代码示例

curl https://llm.bytespike.ai/v1/chat/completions \
  -H "Authorization: Bearer $BYTESPIKE_API_KEY" \
  -H "content-type: application/json" \
  -d '{
    "model": "gpt-4o-image",
    "messages": [{"role": "user", "content": "Generate an image of a koi pond at dusk."}],
    "image_output": {"size": "1024x1024", "quality": "high"}
  }'

多轮编辑工作流

把 assistant 的响应(连同 image url)原样回传到下一次的 messages 数组。 模型把会话上下文里的图作为待编辑的画布:
# Turn 1 — generate
turn1 = client.chat.completions.create(
    model="gpt-4o-image",
    messages=[{"role": "user", "content": "Generate a koi pond at dusk."}],
    extra_body={"image_output": {"size": "1024x1024"}},
)

# Turn 2 — edit
turn2 = client.chat.completions.create(
    model="gpt-4o-image",
    messages=[
        {"role": "user", "content": "Generate a koi pond at dusk."},
        turn1.choices[0].message,
        {"role": "user", "content": "Make it dawn instead, with mist on the water."},
    ],
    extra_body={"image_output": {"size": "1024x1024"}},
)
每一轮作为独立的图像生成计费。

错误

Code触发条件计费?
400 / 401 / 402 / 403标准不计费
451prompt 被上游安全过滤拦截不计费
5xx上游问题不计费(自动重试)

何时选用

  • 多轮图像编辑 —— 会话上下文要紧。
  • 把文字推理和图像输出混合的工作流(模型能描述它生成的东西、提澄清问题)。
  • 一次性 / 批量图像生成,见 GPT-Image 2
  • 纯写实,见 Nano Banana ProNano Banana 2

限制

限制
最大输出分辨率2048×2048
单轮最大张数(n2
多轮编辑
支持 quality 修饰
同步?是(典型 ≤30s)
1024² 平均延迟10-16s