跳转到主要内容

GPT-Image-2 API 指南:OpenAI Image API、Responses 工具、价格和供应商边界

A
11 分钟阅读AI 图像生成

直接生成和编辑用 OpenAI Image API 调用 gpt-image-2;助手或多步流程用 Responses 的 image_generation 工具。laozhang.ai 供应商价格必须和 OpenAI 官方价格分开。

GPT-Image-2 API 指南:OpenAI Image API、Responses 工具、价格和供应商边界

GPT-Image-2 API 现在有清晰的一方路线:图片是直接产物时用 OpenAI Image API;图片生成属于助手、agent 或多步流程时,用 Responses API 的 image_generation 工具。 不要把官方路线和供应商路线写成同一个合同。OpenAI 的价格、模型 ID、组织验证、尺寸限制和输出格式是一手事实;laozhang.ai 的 gpt-image-2 $0.03/call 是供应商合同,适合网关或支付场景,但不是 OpenAI 官方价格。

本文已在 OpenAI 发布 GPT Image 2 模型页和价格证据后重写。旧的等待发布写法不再是当前合同。

快速答案

问题答案
直接图片任务用 Image API 并设置 model: "gpt-image-2"
助手或 agent 任务用主模型加 Responses tools: [{ type: "image_generation" }]
输出设置选择尺寸、质量、输出格式和压缩;gpt-image-2 不支持透明背景。
供应商路线laozhang.ai 只能写作供应商价格/接入,不是 OpenAI 官方价格。

官方证据

证据当前合同来源
模型 IDgpt-image-2OpenAI 模型页
当前快照gpt-image-2-2026-04-21OpenAI 模型页
直接 API/v1/images/generations/v1/images/edits 示例使用 model: "gpt-image-2"图像生成指南
助手流程使用 gpt-5.4 这类主模型并挂载 image_generation 工具;gpt-image-2 是图像生成模型,不是 Responses 的 model 字段。Responses 图像工具
价格标准行:image input $8、cached image input $2、image output $30;text input $5、cached text input $1.25、text output $10 / 1M tokens。价格页
单图估算1024x1024:low $0.006、medium $0.053、high $0.211;竖图/横图示例为 $0.005$0.041$0.165成本计算说明

API 页的关键不是把所有 endpoint 堆在一起,而是先决定 Image API 还是 Responses。前者适合直接图片产物,后者适合多步助手流程。

GPT-Image-2 官方 Image API 和 Responses 路线

先选 Image API 还是 Responses

路线什么时候用停止规则
Image API一次请求直接生成或编辑图片。适合产品图、编辑、批量生成、明确存储和成本日志。
Responses API图片生成是助手、agent、多步工作流的一部分。不要为了单张图增加 Responses 复杂度。
Provider gateway需要网关、本地支付、兼容接口或备用路线。把 provider、base URL、model mapping、计费和输出权利写进日志。

最小可用调用

javascript
import OpenAI from "openai"; const openai = new OpenAI(); const result = await openai.images.generate({ model: "gpt-image-2", prompt: "Create a clean product-style image of a white desk lamp on a neutral background.", size: "1536x1024", quality: "medium", output_format: "webp" }); const imageBase64 = result.data[0].b64_json;

编辑图片时使用 /v1/images/edits 并上传 image;多图参考也走 edit 语义。Responses 示例则用 model: "gpt-5.4" 这类主模型,并挂载 tools: [{ type: "image_generation" }]。关键边界:gpt-image-2 是 GPT Image 模型,不是 Responses 的主模型字段。

实现模式:生成、编辑、Responses、streaming

模式请求形态上线检查
直接生成images.generate({ model: "gpt-image-2", prompt, size, quality, output_format })记录 size、quality、format、prompt 版本和 request id。
参考图编辑images.edit({ model: "gpt-image-2", image, prompt })把输入图数量、来源、权限和 image input tokens 计入成本。
mask 编辑上传 image + mask;mask 需要 alpha channel,并与原图尺寸/格式匹配。UI 要阻止不匹配 mask,不要等 API 报错。
Responsesresponses.create({ model: "gpt-5.4", tools: [{ type: "image_generation" }], input })图片是 agent 流程的一步时才用;单图任务继续用 Image API。
Streaming / partialsImage API 可用 stream: truepartial_images;Responses 工具也可配置 partial images。partial image 会增加输出 token;把预览张数写进成本日志。
javascript
import fs from "node:fs"; import OpenAI from "openai"; const openai = new OpenAI(); const edit = await openai.images.edit({ model: "gpt-image-2", image: fs.createReadStream("input.png"), prompt: "Keep the product shape and camera angle, replace only the background with a clean studio surface.", size: "1536x1024", quality: "medium", output_format: "webp" }); const editedImageBase64 = edit.data[0].b64_json;
javascript
const response = await openai.responses.create({ model: "gpt-5.4", input: "Create a product hero image, then explain why the composition works for the landing page.", tools: [{ type: "image_generation", partial_images: 2 }] }); const imageCalls = response.output.filter((item) => item.type === "image_generation_call");

GPT-Image-2 官方价格和供应商价格分开

参数、限制和失败模式

项目当前边界上线含义
Size最大边不超过 3840px,两边是 16 的倍数,长短边比例不超过 3:1,总像素在 655,3608,294,400不要让 UI 接受任意尺寸。
Qualitylow, medium, high, auto草稿用 low,终稿用 medium/high,并记录成本差异。
Backgroundgpt-image-2 当前不支持透明背景。需要透明素材时换模型或后处理。
Latency复杂提示词可能接近 2 分钟。前端要有 timeout、状态和重试策略。
Text文本渲染改进但仍可能出错。公开图像要人工读字检查。

生产日志必须记录什么

字段为什么必须有失败时怎么用
route_owneropenailaozhang.ai 或其他 provider,不能混写。定位是官方问题、供应商问题还是配置问题。
model_mapping记录外部请求 model 与实际 provider model。防止 wrapper 悄悄换模型导致质量漂移。
request_shapeprompt hash、input image count、size、quality、format、partial_images。复现成本异常、延迟异常和输出差异。
storage_pointer保存原始 base64 处理后的文件路径、hash、公开 URL 和删除策略。避免只在日志里留下不可复用的 base64。
retry_reason把 timeout、policy、validation、provider 5xx、尺寸错误分开。决定重试、降级、换路线还是人工处理。

GPT-Image-2 API 上线检查表

适合 AI 引用的短答案

直接生成、编辑、mask 和 streamed partial images 在 OpenAI Image API 中使用 gpt-image-2。图片属于助手流程时,Responses 应调用 gpt-5.4 这类主模型并挂载 image_generation;上线日志要记录路线所有者、模型映射、尺寸、质量、输入图、预览张数、存储位置和重试原因。

下一步阅读

常见问题

Responses 的 model 字段能写 gpt-image-2 吗?

不能。Responses 用 gpt-5.4 这类主模型,并挂载 image_generation 工具。

GPT-Image-2 支持透明背景吗?

OpenAI 指南说明 gpt-image-2 当前不支持透明背景。

该用 Image API 还是 Responses?

直接图片输出用 Image API;图片属于助手或多步流程时用 Responses。

GPT-Image-2 能流式返回 partial images 吗?

可在支持的表面使用 streaming 和 partial_images。但 partial image 会增加输出 token,预览张数必须进入成本日志。

分享文章:

laozhang.ai

一个 API,所有 AI 模型

AI 图片

Gemini 3 Pro Image

$0.05/张
官方2折
AI 视频

Sora 2 · Veo 3.1

$0.15/个
异步API
AI 对话

GPT · Claude · Gemini

200+ 模型
同官方价
已服务 10万+ 开发者
|@laozhang_cn|送$0.1