🟢OpenAI Image Models

TTAPI整合openai的优秀图片模型,让你能以更为优惠的价格且方便的方式集成到你的服务。

OpenAI Create image

gpt-image-1 模型官方耗时比较长,建议使用我们的 https://api.ttapi.org 网关,避免请求超时

POST https://api.ttapi.io/v1/images/generations

根据文本以及图片提示创建图像,转自openai官方接口,支持模型 gpt-image-1, dall-e-2, dall-e-3

文档翻译自官方文档,如已对接官方文档可直接对接使用,所有入参出参结构与支持均一致,定价详见

Headers

Name
Value

Content-Type

application/json

TT-API-KEY

用于请求授权 TT-API 的API密钥

Body

参数
类型
是否必须
描述

prompt

string

图像的文本描述gpt-image-1 的最大长度为 32000 个字符,dall-e-2 的最大长度为 1000 个字符,dall-e-3 的最大长度为 4000 个字符。

background

string

允许设置生成图像背景的透明度。 此参数仅适用于 gpt-image-1。可选值 transparentopaqueauto(默认)之一。使用 auto 时,模型将自动确定图像的最佳背景。

如果设置为透明,则输出格式需要支持透明度,因此应设置为 png 或 webp。

model

string

支持模型

gpt-image-1

dall-e-2(默认)

dall-e-3

moderation

string

控制 gpt-image-1 生成的图片的内容审核级别low(用于限制较少的过滤)或 auto(默认值)。

n

integer

生成图像数量,默认值为1 可选范围1-10dall-e-3为固定值1

output_compression

integer

生成图像的压缩级别 (0-100%)。此参数仅支持输出格式为 webp 或 jpeg 的 gpt-image-1,默认为 100

output_format

string

返回图像格式。此参数仅适用于 gpt-image-1。可选值 png(默认)、jpegwebp

quality

string

图片质量,可选范围: auto(默认值)将自动为给定模型选择最佳质量。 gpt-image-1 支持highmediumlow三种质量。 dall-e-3 支持 hdstandard。 dall-e-2 仅支持 standard

response_format

string

返回数据格式 dall-e-3, dall-e-2 支持 urlb64_json,url有效期为60分钟,请获取到数据后第一时间缓存。 gpt-image-1 仅支持 b64_json

size

string

图像尺寸

gpt-image-1 可选范围: 1024x1024 1536x1024 1024x1536 auto(默认)

dall-e-2 可选范围: 256x256 512x512 1024x1024 dall-e-3 可选范围: 1024x1024 1792x1024 1024x1792 注意:不同尺寸消耗ttapi quota不同

style

string

生成图像的风格。此参数仅支持 dall-e-3。 可选值:

vivid(生动)

natural(自然)

请求示例

返回示例

OpenAI Create image edit

POST https://api.ttapi.io/v1/images/edits

根据给定的一个或多个源图像和提示,编辑或扩展图像。支持模型 gpt-image-1, dall-e-2

文档翻译自官方文档,如已对接官方文档可直接对接使用,所有入参出参结构与支持均一致,定价详见

Headers

Name
Value

Content-Type

application/json

TT-API-KEY

用于请求授权 TT-API 的API密钥

Body

参数
类型
是否必须
描述

image

array[file]

要编辑的图片。必须是受支持的图片文件或图片数组。 gpt-image-1,每张图片应为小于 25MB 的 png、webp 或 jpg 文件。 dall-e-2,您只能提供一张图片,并且该图片应为小于 4MB 的方形 png 文件。

prompt

string

图像的文本描述gpt-image-1 的最大长度为 32000 个字符,dall-e-2 的最大长度为 1000 个字符

mask

file

一张附加图片,其完全透明区域(例如,Alpha 值为零)指示应编辑图片的位置。如果提供了多张图片,则蒙版将应用于第一张图片。必须是有效的 PNG 文件,大小小于 4MB,且尺寸与图片相同。

model

string

支持模型

gpt-image-1

dall-e-2(默认)

n

integer

生成图像数量,默认值为1 可选范围1-10

output_compression

integer

生成图像的压缩级别 (0-100%)。此参数仅支持输出格式为 webp 或 jpeg 的 gpt-image-1,默认为 100

quality

string

图片质量,可选范围: auto(默认值)将自动为给定模型选择最佳质量。 gpt-image-1 支持highmediumlow三种质量。 dall-e-2 仅支持 standard

response_format

string

返回数据格式 dall-e-2 支持 urlb64_json,url有效期为60分钟,请获取到数据后第一时间缓存。 gpt-image-1 仅支持 b64_json

size

string

图像尺寸

gpt-image-1 可选范围: 1024x1024 1536x1024 1024x1536 auto(默认)

dall-e-2 可选范围: 256x256 512x512 1024x1024 注意:不同尺寸消耗ttapi quota不同

请求示例

返回示例

Dalle3 生成图像

POST https://api.ttapi.io/openai/v1/images/generations

根据文本提示使用DALL·E 3模型创建图像。DALL·E 3模型相对于市场上的其他模型而言对文字理解能力最强,你可以使用任何语言作为你的描述文案,价格详见此接口已不推荐使用

Headers

Name
Value

Content-Type

application/json

TT-API-KEY

用于请求授权 TT-API 的API密钥

Body

参数
类型
是否必须
描述

prompt

string

dall-e-3模型,描述词长度不能超过4000个字符

size

string

图像尺寸,可选范围:

1024x1024

1024x1792

1792x1024 注意:不同尺寸消耗ttapi quota不同

model

string

固定值:dall-e-3

n

integer

生成图像数量,固定值:1

quality

string

图片质量,可选范围: standard - 标准 hd - 增强细节

注意:dalle3接口的任务结果是同步返回的并不需要异步回调或者再次去查询该任务结果,接口响应时间一般在3-15s中间,时效同步根据OpenAI官方。

请求示例

返回示例

Dalle3 返回图片存在有效期限制,使用请自行转存图片

GPT-4o 生成图像

POST https://api.ttapi.io/openai/4o-image/generations

根据文本提示以及图片资源生成图片

注意:由于openai目前暂未以api形式提供该接口,所以该接口目前为逆向接口。稳定性可能存在波动,目前整体定价较为便宜,后续官方正式上线后,可能会同步调整接口字段以及定价。

Headers

Name
Value

Content-Type

application/json

TT-API-KEY

用于请求授权 TT-API 的API密钥

Body

参数
类型
是否必须
描述

prompt

string

生成图片文字提示,因为目前为逆向模型,建议文案提示存在关键字:“画一张xxx”, “生成一张”,"draw a xxx",具体语言不限制,openai本身就支持多语言模型,中文支持也非常友好。

referImages

array

垫图数组,示例:

hookUrl

string

回调地址,任务完成或失败将通过请地址进行通知。如果未设置,则需要请求fetch 接口进行查询。

请求示例

返回示例

GPT-4o生成结果查询

POST/GET https://api.ttapi.io/openai/4o-image/fetch

获取GPT-4o生成任务结果,返回数据结构与hookUrl中返回一致

Headers

Name
Value

Content-Type

application/json

TT-API-KEY

用于请求授权 TT-API 的API密钥

Query / Body

参数
类型
是否必须
描述

jobId

string

生成接口返回的jobId

请求示例

GPT-4o 异步响应JSON示例

GPT-4o 使用案例

应用场景/实践案例:

  • 制作海报(我的垫图可能不太恰当,随便官网首页截了个图,具体实际使用需要调试)

提示词:结合图片,生成一张GPT-4o宣传海报,要求海报简洁大气,存在TTAPI的logo,科技风格主题

结合图片,生成一张GPT-4o宣传海报,要求海报简洁大气,存在TTAPI的logo,科技风格主题
  • 文章插画

提示词:一张图详细解释马斯洛需求层次理论

一张图详细解释马斯洛需求层次理论
  • 模特试衣

提示词:画一张美女模特该衣服平面照拍摄照片,要求高像素,高逼真度,完美还原衣服所有细节,全身照专业姿势,身材性感,穿着潮流,面带微笑,欧美女性皮肤白皙

  • 产品封面

  • 小说插画

  • 等等各种你能想到的复杂场景

总结:

OpenAI推出的这个4o图片模型在现在的AI市场里来说显然是一个王炸模型,个人觉得文生图不是他最强的所在,最强的关键点在于改图以及垫图生图

优点:

  • 文本支持好。基于OpenAI llm大模型语言理解能力强,文字支持友好不像其他图片模型的鬼画符或者需要双引号+英文限制才会有概率的在图片中贴上你想要的文本

  • 垫图识图。支持依据文案加识别就可以更改上传图片中的元素,或者依据上传图片生成你想要的场景图,这一点目前没有任何全品类的图片模型可以做到

不足:

  • 人物刻画。目前尝试,人物的刻画能力与Midjourney对比来说会差一些,比如要求生成的任务客户到汗珠,皮肤纹理,发丝等等。

  • 尺寸控制。目前由于官方还未给出api,整体图片的尺寸很难通过提示词进行精准的控制

  • 细节把控。目前需要高精度的使用场景,很难做到细节的刻画与把控

Last updated

Was this helpful?