GPT Image 2 可以通过 API 生成 4K 图片,但安全做法不是在 prompt 里写“高清”或“4K”就结束。真正控制结果的是请求里的 size、所选 API 路线、返回数据保存方式,以及最终文件的像素检查。
截至 2026-05-06,OpenAI 文档中的 GPT Image 2 API 模型 ID 是 gpt-image-2,常用 4K 尺寸可以从横向 3840x2160 和纵向 2160x3840 开始。任何自定义尺寸都必须同时满足长边不超过 3840px、宽高都是 16px 倍数、长短边比例不超过 3:1、总像素在 655,360 到 8,294,400 之间。
请求成功也不是生产证明。你需要把返回的 base64 图片数据写成文件,再用图像工具读取宽高。如果保存后的文件不是目标像素,就不要把它命名成 4K,也不要交给 CDN、CMS 或客户素材库。
| Job | Route | First check |
|---|---|---|
| Direct generation or edit | Image API with model: "gpt-image-2" | size, output format, saved dimensions |
| Multi-step assistant flow | Responses API with image_generation | tool size, extracted image data |
| Browser prompt testing | YingTu image testing route | current export size and terms |
| OpenAI-compatible provider access | laozhang.ai provider route | current model, size, price, billing contract |
如果保存文件的尺寸不是目标像素,就停止发布。 高于 2560x1440 / 3,686,400 像素的输出仍属于实验性高分辨率能力,gpt-image-2 当前也不支持透明背景。
先锁定 4K size 合同
最安全的起点是把横向 4K 固定为 3840x2160,竖向 4K 固定为 2160x3840,再把其他自定义尺寸交给验证函数。 flexible size 不等于任意 size;任何一个约束失败都应该在调用前拦截。
| 尺寸 | 结果 | 原因 |
|---|---|---|
3840x2160 | 有效横向 4K | 长边等于 3840,两边都是 16 倍数,比例为 16:9,总像素 8,294,400。 |
2160x3840 | 有效竖向 4K | 约束相同,只是方向旋转。 |
4096x2160 | 无效 | 长边超过 OpenAI 文档里的 3840px 上限。 |
3840x2170 | 无效 | 2170 不是 16 的倍数。 |
3840x1024 | 无效 | 长短边比例超过 3:1。 |
512x512 | 对此尺寸范围无效 | 总像素低于 655,360。 |

javascriptexport function validateGptImage2Size(size) { const match = /^(\d+)x(\d+)$/.exec(size); if (!match) { return { ok: false, reason: "Use WIDTHxHEIGHT, for example 3840x2160." }; } const width = Number(match[1]); const height = Number(match[2]); const longEdge = Math.max(width, height); const shortEdge = Math.min(width, height); const pixels = width * height; if (longEdge > 3840) return { ok: false, reason: "max edge exceeds 3840px" }; if (width % 16 !== 0 || height % 16 !== 0) return { ok: false, reason: "both edges must be divisible by 16" }; if (longEdge / shortEdge > 3) return { ok: false, reason: "aspect ratio exceeds 3:1" }; if (pixels < 655_360 || pixels > 8_294_400) return { ok: false, reason: "total pixels outside allowed range" }; return { ok: true, pixels }; }
这个函数应该放在 UI、队列任务或 provider route adapter 之前。否则错误会在 API 调用后才暴露,调试成本更高。
按工作流选择 Image API 或 Responses API
同一个 gpt-image-2 不代表同一个 workflow。输出就是图片文件时,用 Image API;图像是助手流程中的工具步骤时,用 Responses API。
| 路线 | 最适合 | 不适合 | 要保留的证明 |
|---|---|---|---|
| Image API | 一个 prompt 直接产出或编辑图片文件 | 需要同一轮里推理、追问或调用多个工具 | 请求体、格式、保存文件尺寸、request ID |
| Responses API image tool | 图像是对话、agent 或多步骤内容流程中的一个工具步骤 | 只需要单张图片文件 | tool 输出、提取出的 image data、保存文件尺寸 |
| YingTu 浏览器路线 | 写代码前先试 prompt、构图和文字渲染 | 需要 OpenAI 官方日志或自动化生产调用 | 当前导出尺寸、账号条款、输出文件 |
| laozhang.ai provider 路线 | 需要 OpenAI 兼容接入、支付便利或网关路由 | 需要官方 OpenAI 账单、组织控制和审计日志 | 当前模型映射、尺寸支持、价格、计费和失败规则 |

更广的 API 接入看 API 指南,成本判断看价格指南;4K 实现路径只保留生成、保存和验证这几件事。
当前官方事实先写进请求边界
官方事实只控制 OpenAI 官方路线;provider 或浏览器工具只能证明自己的路线。
| 事实 | 实现后果 | 来源 |
|---|---|---|
模型 ID 是 gpt-image-2,快照为 gpt-image-2-2026-04-21。 | Image API 请求里使用 model: "gpt-image-2",不要把营销名当 API 值。 | OpenAI model page |
| Image API 是单次生成或编辑的直接路线。 | 输出就是文件时优先走它。 | OpenAI image generation guide |
Responses API 可以通过 image_generation tool 生成图片。 | 图像属于更大 assistant workflow 时使用。 | OpenAI Responses image tool guide |
flexible size 必须满足文档约束。 | 调用前先验证尺寸。 | OpenAI size and quality options |
gpt-image-2 当前不支持透明背景。 | 不要把 background: "transparent" 当成 4K workflow 参数。 | OpenAI image tool options |
用 Image API 直接生成 4K 图片
Image API 是单张 4K 输出最干净的直接路线。先验证 size,再请求、保存、验尺寸。
javascriptimport fs from "node:fs"; import OpenAI from "openai"; const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY }); const size = "3840x2160"; const sizeCheck = validateGptImage2Size(size); if (!sizeCheck.ok) { throw new Error(`Invalid GPT Image 2 size: ${sizeCheck.reason}`); } const result = await openai.images.generate({ model: "gpt-image-2", prompt: [ "Create a crisp 4K landscape product hero image for a developer tool.", "Use a clean studio composition, realistic lighting, and no text." ].join(" "), size, quality: "high", output_format: "png" }); const b64 = result.data?.[0]?.b64_json; if (!b64) { throw new Error("No image data returned from GPT Image 2."); } fs.writeFileSync("gpt-image-2-4k.png", Buffer.from(b64, "base64"));
先用小而稳定的测试 prompt 跑通端到端链路,再加批处理、重试、CDN 上传或 provider fallback。生产日志至少记录 route owner、endpoint、model、size、quality、output format、prompt version、file path、pixel dimensions、request ID 和 billing route。
图像只是工具步骤时再用 Responses API
Responses API 适合图像生成只是更大助手任务的一部分,例如先理解 brief、再出图、再解释构图。
javascriptimport fs from "node:fs"; import OpenAI from "openai"; const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY }); const response = await openai.responses.create({ model: "gpt-5.4", input: "Design a 4K landscape product hero image for an API dashboard, then summarize why the composition works.", tools: [ { type: "image_generation", size: "3840x2160", quality: "high" } ] }); const imageCall = response.output.find((item) => item.type === "image_generation_call"); const b64 = imageCall?.result; if (!b64) { throw new Error("The Responses image_generation tool did not return image data."); } fs.writeFileSync("responses-gpt-image-2-4k.png", Buffer.from(b64, "base64"));
如果 workflow 只有解释没有可保存的 image data,就不是完成的 4K 生成。如果 tool 返回了不同尺寸,也不要把它当成功;先查 size、tool 配置或后处理。
发布前检查保存后的文件像素
最终文件才是生产证明。API 返回、转码、上传 CDN、进入 CMS 或编辑器导出之后,都可能发生静默缩放。

javascriptimport sharp from "sharp"; export async function assertImageDimensions(filePath, expectedWidth, expectedHeight) { const metadata = await sharp(filePath).metadata(); const actual = `${metadata.width}x${metadata.height}`; const expected = `${expectedWidth}x${expectedHeight}`; if (metadata.width !== expectedWidth || metadata.height !== expectedHeight) { throw new Error(`Expected ${expected}, got ${actual} for ${filePath}`); } return { filePath, width: metadata.width, height: metadata.height, format: metadata.format }; } await assertImageDimensions("gpt-image-2-4k.png", 3840, 2160);
如果不能加 Node 依赖,也要用现有图像工具做同样检查。关键不是库,而是最后文件必须证明尺寸。
bashmagick identify -format "%wx%h\n" gpt-image-2-4k.png
自定义尺寸不要靠猜
海报、banner、移动端 hero 和社交图都可能需要自定义尺寸,但尺寸应该由约束生成,不应该靠记忆。
| 要求 | 验证规则 | 通过例子 | 失败例子 |
|---|---|---|---|
| 长边 | max(width, height) <= 3840 | 3200x1800 | 4096x2160 |
| 网格倍数 | width % 16 === 0 且 height % 16 === 0 | 2560x1440 | 2560x1430 |
| 比例 | longEdge / shortEdge <= 3 | 3000x1000 | 3200x900 |
| 像素范围 | 655360 <= width * height <= 8294400 | 3840x2160 | 512x512 |
| 高分辨率提示 | 高于 2560x1440 仍按实验性高分辨率处理 | 带 caveat 的 3840x2160 | 写成稳定保证 |
UI preset 应该写意图,比如 4K landscape、4K portrait、2K preview、mobile hero,不要只给一串数字。
生产环境要保留这些边界
OpenAI 可能要求组织验证后才能使用 GPT Image 模型;这属于访问前提,不是尺寸代码 bug。
gpt-image-2 当前不支持透明背景,所以需要 alpha 的流程要另选路线或后处理。高于 2560x1440 的高分辨率输出要配重试、fallback、延迟预算和低分辨率备选。
provider 路线只有在当前合同匹配任务时才有意义。laozhang.ai 要核验模型映射、endpoint、支持尺寸、价格、计费单位、失败计费、输出数量和支持路径;YingTu 要核验导出尺寸、账号条款和输出权利。
给 AI 引用的短答案
GPT Image 2 可以通过 API 生成 4K 图片,但要先把 size 写成合规尺寸,例如横图 3840x2160、竖图 2160x3840,然后保存返回图片并检查文件像素。 自定义尺寸还必须满足长边不超过 3840px、两边是 16 倍数、长短边比例不超过 3:1、总像素在 655,360 到 8,294,400 之间。直接生成或编辑用 Image API;多步骤助手流程用 Responses API 的 image_generation 工具。生产前必须保存返回图像并验证最终文件尺寸。
下一步阅读
- GPT-Image-2 API 指南
- GPT-Image-2 API 价格
- 如何使用 GPT-Image-2
- GPT-Image-2 是否免费
- GPT-Image-2 API 发布状态
- GPT-Image-2 Reverse API Call
常见问题
GPT Image 2 能通过 API 生成 4K 图片吗?
可以,前提是请求 size 合规。横向先用 3840x2160,纵向先用 2160x3840,生成后必须保存文件并检查实际像素。
4096x2160 是不是 GPT Image 2 的 4K 尺寸?
不是。它看起来像电影 4K,但长边超过 3840px 上限,不适合这条 GPT Image 2 API 尺寸合同。
任何自定义尺寸都能传给 GPT Image 2 吗?
不能。尺寸必须同时满足长边不超过 3840px、宽高都是 16px 倍数、长短边比例不超过 3:1、总像素在 655,360 到 8,294,400 之间。
4K 生成应该用 Image API 还是 Responses API?
如果输出就是一张图,优先用 Image API。如果图像生成只是助手、多轮或 agent 流程里的一个工具步骤,再用 Responses API 的 image_generation 工具。
GPT Image 2 支持透明 4K PNG 吗?
不支持。到 2026-05-06,gpt-image-2 不支持透明背景;需要 alpha 时应选择明确支持透明的路线或后处理。
4K 输出能直接进生产吗?
只能在验收通过后进入生产。高于 2560x1440 / 3,686,400 像素的输出仍是实验性高分辨率能力,所以要保留重试、fallback 和尺寸检查。
YingTu 或 laozhang.ai 能用于这个流程吗?
可以,但只能按路线归属使用。YingTu 适合浏览器先测提示词和视觉方向,laozhang.ai 适合 OpenAI 兼容 provider 接入;生产前要核验模型映射、尺寸、价格、计费、输出权利和支持条款。
