gpt-image-2 是站点提供的 OpenAI GPT Image 图像生成模型。它通过 OpenAI Image API 兼容接口接入,适合高质量文生图、图像编辑、多参考图融合、商品图、海报、设计稿和需要灵活像素尺寸的生产图像场景。与 Gemini 图像模型不同,gpt-image-2 使用 OpenAI 风格的 /v1/images/* 路径,图片尺寸使用 WxH 像素或 auto,不是 1K、2K、4K 分辨率桶。| 项目 | 说明 |
|---|---|
| 模型 ID | gpt-image-2 |
| 接口类型 | OpenAI Image API 兼容接口 |
| 版本状态 | 以站点模型配置、上游可用性和上游账号权限为准 |
| 主要能力 | 文生图、图像编辑、多参考图、局部编辑、文字渲染、灵活像素尺寸输出 |
| 默认服务地址 | https://api.token5u.cn |
https://api.token5u.cn/v1/images/generations
https://api.token5u.cn/v1/images/edits| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
Authorization | string | 是 | Bearer Token,格式为 Bearer YOUR_API_KEY。 |
Content-Type | string | 是 | 文生图通常为 application/json;上传图片编辑时为 multipart/form-data。 |
{
"model": "gpt-image-2",
"prompt": "Create a premium product poster for a transparent perfume bottle on wet black stone, with crisp studio lighting and elegant typography.",
"n": 1,
"size": "1536x1024",
"quality": "auto",
"output_format": "png",
"moderation": "auto"
}| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
model | string | 是 | - | 固定传 gpt-image-2。 |
prompt | string | 是 | - | 文本 prompt。建议写清主体、场景、材质、光线、构图、风格和需要渲染的文字。 |
n | integer | 否 | 1 | 返回图片数量。建议生产调用先保持 1,便于控制延迟和成本。 |
size | string | 否 | auto | 输出尺寸。可传 auto 或满足约束的 宽x高 像素值,例如 1024x1024、1536x1024、1024x1536。 |
quality | string | 否 | auto | 渲染质量,可选 auto、low、medium、high。草稿可用 low,最终资产建议使用 medium 或 high。 |
output_format | string | 否 | png | 输出格式,可选 png、jpeg、webp。关注延迟和体积时可优先考虑 jpeg。 |
output_compression | integer | 否 | - | JPEG/WebP 压缩比例,范围 0 到 100;仅在 output_format 为 jpeg 或 webp 时有意义。 |
background | string | 否 | auto | 背景策略。gpt-image-2 当前不支持 transparent,不要传透明背景。 |
moderation | string | 否 | auto | 内容过滤强度,可选 auto、low。 |
response_format | string | 否 | 渠道默认 | 网关扩展参数,非 OpenAI 官方字段。控制网关返回图片的形态,可选 b64_json、url;其他取值会被网关静默归一为 url。默认值由渠道配置决定,未配置时使用 url。当用户值与上游实际返回形态不一致时,网关会自动转换(URL 下载并 base64 编码,或 base64 上传至对象存储后返回 URL)。 |
size 尺寸规则gpt-image-2 支持动态像素尺寸,常用值如下:| 场景 | 推荐值 |
|---|---|
| 自动选择 | auto |
| 正方形 | 1024x1024、2048x2048 |
| 横图 | 1536x1024、2048x1152、3840x2160 |
| 竖图 | 1024x1536、2160x3840 |
| 约束 | 规则 |
|---|---|
| 最大边长 | 宽和高都必须小于或等于 3840px。 |
| 边长倍数 | 宽和高都必须是 16px 的倍数。 |
| 宽高比 | 长边与短边比例不能超过 3:1。 |
| 总像素 | 总像素不能小于 655360,不能大于 8294400。 |
2560x1440(3686400 像素)的输出通常可视为 2K 以上实验性尺寸,建议先做小批量验证再进入生产流量。/v1/images/edits 同时支持以下两种方式上传参考图:| 方式 | 路径 | Content-Type | 图片参数 |
|---|---|---|---|
| 二进制上传 | /v1/images/edits | multipart/form-data | image[] |
| JSON + URL/Base64 | /v1/images/edits | application/json | images(URL 或 base64 字符串数组) |
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 固定传 gpt-image-2。 |
prompt | string | 是 | 编辑指令。建议说明保留哪些元素、修改哪些区域、目标风格和文字要求。 |
image[] | file[] | 是 | 输入图片二进制流。可传一张待编辑图,也可传多张参考图。 |
mask | file | 否 | 局部编辑遮罩。多图场景下遮罩应用于第一张图片。 |
size | string | 否 | 输出尺寸,规则同文生图。 |
quality | string | 否 | 可选 auto、low、medium、high。 |
output_format | string | 否 | 可选 png、jpeg、webp。 |
output_compression | integer | 否 | JPEG/WebP 压缩比例,范围 0 到 100。 |
moderation | string | 否 | 可选 auto、low。 |
response_format | string | 否 | 网关扩展参数,非 OpenAI 官方字段。同文生图,可选 b64_json、url,无效值会被静默归一为 b64_json。 |
image,可以传文件数组;cURL/multipart 请求中使用重复的 image[] 表单字段。| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 固定传 gpt-image-2。 |
prompt | string | 是 | 编辑指令。 |
images | array | 是 | 参考图列表。每个元素可以是 HTTP/HTTPS URL、data:image/...;base64,... data URL、纯 base64 字符串,或 {"image_url": "..."} / {"url": "..."} 对象形式。URL 会由网关下载,等价于 image[] 文件上传。 |
size | string | 否 | 输出尺寸,规则同文生图。 |
quality | string | 否 | 可选 auto、low、medium、high。 |
response_format | string | 否 | 网关扩展参数。同 image[] 二进制请求。 |
| 要求 | 说明 |
|---|---|
| 尺寸 | mask 必须和待编辑图片尺寸一致。 |
| 格式 | mask 必须和待编辑图片格式一致。 |
| 大小 | 单个图片或遮罩文件应小于 50MB。 |
| 透明通道 | mask 需要包含 alpha 通道。 |
| 精度 | GPT Image 会将 mask 作为提示引导,但不保证完全逐像素贴合遮罩形状。 |
gpt-image-2 对图片输入默认按高保真处理,不需要也不允许通过 input_fidelity 调低保真度。包含参考图或待编辑图的请求会产生图片输入 tokens,成本通常高于纯文生图。ImagesResponse:{
"created": 1777347817,
"data": [
{
"b64_json": "BASE64_IMAGE_DATA",
"revised_prompt": "..."
}
],
"model": "gpt-image-2",
"usage": {
"total_tokens": 772,
"input_tokens": 212,
"output_tokens": 560,
"input_tokens_details": {
"text_tokens": 120,
"image_tokens": 92
}
}
}| 参数 | 类型 | 说明 |
|---|---|---|
created | integer | 响应创建时间戳。 |
data | Image[] | 图片结果列表。站点会优先返回 b64_json,便于直接保存为文件。 |
model | string | 实际模型 ID,是否返回取决于上游。 |
usage | object | token 使用量统计。计费通常需要同时关注文本输入、图片输入和图片输出 tokens。 |
Image| 参数 | 类型 | 说明 |
|---|---|---|
b64_json | string | Base64 编码图片数据。当 response_format 解析为 b64_json(默认)时返回该字段。 |
url | string | 图片 URL。当 response_format 解析为 url 时返回该字段;网关会按需将上游 base64 上传至对象存储并填入该 URL。 |
revised_prompt | string | 上游可能返回的改写后 prompt。 |