
GPT-image-1 – OpenAI 推出的最新图像生成模型
GPT-image-1是什么GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台
GPT-image-1是什么
GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台采用。

GPT-image-1的主要功能
-
文本生成图像:根据文本描述生成图像。
-
图像编辑:对现有图像进行修改或局部编辑。
-
图像变体:生成图像的不同版本或风格变体。
- 自定义功能:
- 尺寸:支持多种分辨率,如1024×1024、1024×1536等。
- 质量:低、中、高三种渲染质量可选。
- 格式:支持PNG、JPEG、WebP等格式。
- 压缩:针对JPEG和WebP格式,可设置0-100%的压缩级别。
- 背景:支持透明背景或不透明背景。
- API访问: 提供API接口,支持开发者将图像生成功能集成到自己的应用或服务中,支持批量生成图像。
GPT-image-1的模型特点
- 超强指令遵循:精确理解和执行复杂指令,确保生成图像的准确性。
- 超多艺术风格:支持多种艺术风格,适用于不同创意需求。
- 精准图像编辑:提供强大的图像编辑能力,用户基于基于文本提示对图像进行精细调整。
- 丰富的真实世界知识:生成与真实世界相关的图像内容,增强图像的可信度和实用性。
- 文本一致性生成:在生成图像时,保持文本内容的一致性和连贯性,适用于教育材料、故事书等场景。
GPT-image-1的产品定价
- 文本输入token(提示文本):5 美元/100 万枚 token
- 图像输入token(输入图像):10 美元/100 万枚 token
- 图像输出token(生成的图像):40 美元/100 万枚 token
GPT-image-1的项目地址
- 项目官网:https://openai.com/index/image-generation-api/
如何使用GPT-image-1
- 准备工作:放问OpenAI官方网站注册账户。注册完成后,登录账户获取API密钥(API Key)。
- 安装OpenAI Python库:在Python环境中安装OpenAI的官方库。打开终端或命令提示符,运行以下命令:
pip install openai
- 配置API密钥:在代码中配置OpenAI API密钥。建议将密钥存储在环境变量中,避免直接暴露在代码中。
import os
import openai
# 设置API密钥
openai.api_key = os.getenv("OPENAI_API_KEY")
- 调用图像生成API:
- 图像生成:基于文本提示生成图像。以下是一个简单的示例代码:
import openai
import base64
# 初始化OpenAI客户端
client = openai.OpenAI()
# 调用图像生成API
result = client.images.generate(
model="gpt-image-1", # 指定模型
prompt="A futuristic cityscape at sunset with flying cars and neon lights", # 文本提示
size="1024x1024", # 图像尺寸
quality="high", # 图像质量
background="transparent" # 背景设置为透明
)
# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
# 保存图像到本地文件
with open("futuristic_cityscape.png", "wb") as f:
f.write(image_bytes)
-
- 图像编辑:对现有图像进行编辑。以下是一个示例代码:
import openai
# 初始化OpenAI客户端
client = openai.OpenAI()
# 调用图像编辑API
result = client.images.edit(
model="gpt-image-1", # 指定模型
image=open("input_image.png", "rb"), # 上传需要编辑的图像
mask=open("mask.png", "rb"), # 上传蒙版图像
prompt="Replace the sky with a starry night", # 编辑提示
size="1024x1024", # 图像尺寸
quality="high" # 图像质量
)
# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
# 保存编辑后的图像到本地文件
with open("edited_image.png", "wb") as f:
f.write(image_bytes)
-
- 使用参考图像生成新图像:上传多张参考图像生成新的图像。以下是一个示例代码:
import openai
# 初始化OpenAI客户端
client = openai.OpenAI()
# 调用参考图像生成API
result = client.images.edit(
model="gpt-image-1", # 指定模型
image=[
open("body-lotion.png", "rb"),
open("bath-bomb.png", "rb"),
open("incense-kit.png", "rb"),
open("soap.png", "rb"),
], # 上传参考图像
prompt="Generate a photorealistic image of a gift basket on a white background labeled "Relax & Unwind" with a ribbon and handwriting-like font, containing all the items in the reference pictures", # 生成提示
size="1024x1024", # 图像尺寸
quality="high" # 图像质量
)
# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
# 保存生成的图像到本地文件
with open("gift_basket.png", "wb") as f:
f.write(image_bytes)
GPT-image-1的应用案例
- Adobe:集成到Firefly和Express应用中,提供不同图片风格。
- Figma:基于简单提示生成和编辑图像,帮助设计师快速获取想法。
- HeyGen:增强头像创建和编辑功能。
- Wix:帮助用户快速将想法转化为现实。
- Photoroom:帮助在线卖家基于产品照片创建工作室品质的视觉效果。
GPT-image-1的应用场景
- 创意设计:快速将草图转化为高质量图形元素,支持高保真视觉编辑。
- 电商与营销:生成产品展示图、营销海报和社交媒体图像,提升视觉效果。
- 品牌设计:创建可编辑的徽标、品牌视觉资产和专业排版。
- 视频创作:增强视频编辑功能,生成高质量头像和动画效果。
- 教育与内容创作:生成教学插图和创意内容,辅助教育和创作。
发表评论 取消回复