Midjourney操作界面

GPT-image-1 – OpenAI 推出的最新图像生成模型

GPT-image-1是什么GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台

GPT-image-1是什么

GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台采用。

GPT-image-1

GPT-image-1的主要功能

  • 文本生成图像:根据文本描述生成图像。
  • 图像编辑:对现有图像进行修改或局部编辑。
  • 图像变体:生成图像的不同版本或风格变体。
  • 自定义功能
    • 尺寸:支持多种分辨率,如1024×1024、1024×1536等。
    • 质量:低、中、高三种渲染质量可选。
    • 格式:支持PNG、JPEG、WebP等格式。
    • 压缩:针对JPEG和WebP格式,可设置0-100%的压缩级别。
    • 背景:支持透明背景或不透明背景。
  • API访问: 提供API接口,支持开发者将图像生成功能集成到自己的应用或服务中,支持批量生成图像。

GPT-image-1的模型特点

  • 超强指令遵循:精确理解和执行复杂指令,确保生成图像的准确性。
  • 超多艺术风格:支持多种艺术风格,适用于不同创意需求。
  • 精准图像编辑:提供强大的图像编辑能力,用户基于基于文本提示对图像进行精细调整。
  • 丰富的真实世界知识:生成与真实世界相关的图像内容,增强图像的可信度和实用性。
  • 文本一致性生成:在生成图像时,保持文本内容的一致性和连贯性,适用于教育材料、故事书等场景。

GPT-image-1的产品定价

  • 文本输入token(提示文本):5 美元/100 万枚 token
  • 图像输入token(输入图像):10 美元/100 万枚 token
  • 图像输出token(生成的图像)​​:40 美元/100 万枚 token

GPT-image-1的项目地址

  • 项目官网:https://openai.com/index/image-generation-api/

如何使用GPT-image-1

  • 准备工作:放问OpenAI官方网站注册账户。注册完成后,登录账户获取API密钥(API Key)。
  • 安装OpenAI Python库:在Python环境中安装OpenAI的官方库。打开终端或命令提示符,运行以下命令:
pip install openai
  • 配置API密钥:在代码中配置OpenAI API密钥。建议将密钥存储在环境变量中,避免直接暴露在代码中。
import os
import openai

# 设置API密钥
openai.api_key = os.getenv("OPENAI_API_KEY")
  • 调用图像生成API:
    • 图像生成:基于文本提示生成图像。以下是一个简单的示例代码:
import openai
import base64

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像生成API
result = client.images.generate(
    model="gpt-image-1",  # 指定模型
    prompt="A futuristic cityscape at sunset with flying cars and neon lights",  # 文本提示
    size="1024x1024",  # 图像尺寸
    quality="high",  # 图像质量
    background="transparent"  # 背景设置为透明
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存图像到本地文件
with open("futuristic_cityscape.png", "wb") as f:
    f.write(image_bytes)
    • 图像编辑:对现有图像进行编辑。以下是一个示例代码:
import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用图像编辑API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=open("input_image.png", "rb"),  # 上传需要编辑的图像
    mask=open("mask.png", "rb"),  # 上传蒙版图像
    prompt="Replace the sky with a starry night",  # 编辑提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存编辑后的图像到本地文件
with open("edited_image.png", "wb") as f:
    f.write(image_bytes)
    • 使用参考图像生成新图像:上传多张参考图像生成新的图像。以下是一个示例代码:
import openai

# 初始化OpenAI客户端
client = openai.OpenAI()

# 调用参考图像生成API
result = client.images.edit(
    model="gpt-image-1",  # 指定模型
    image=[
        open("body-lotion.png", "rb"),
        open("bath-bomb.png", "rb"),
        open("incense-kit.png", "rb"),
        open("soap.png", "rb"),
    ],  # 上传参考图像
    prompt="Generate a photorealistic image of a gift basket on a white background labeled "Relax & Unwind" with a ribbon and handwriting-like font, containing all the items in the reference pictures",  # 生成提示
    size="1024x1024",  # 图像尺寸
    quality="high"  # 图像质量
)

# 获取生成的图像数据
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# 保存生成的图像到本地文件
with open("gift_basket.png", "wb") as f:
    f.write(image_bytes)

GPT-image-1的应用案例

  • Adobe:集成到Firefly和Express应用中,提供不同图片风格。
  • Figma:基于简单提示生成和编辑图像,帮助设计师快速获取想法。
  • HeyGen:增强头像创建和编辑功能。
  • Wix:帮助用户快速将想法转化为现实。
  • Photoroom:帮助在线卖家基于产品照片创建工作室品质的视觉效果。

GPT-image-1的应用场景

  • 创意设计:快速将草图转化为高质量图形元素,支持高保真视觉编辑。
  • 电商与营销:生成产品展示图、营销海报和社交媒体图像,提升视觉效果。
  • 品牌设计:创建可编辑的徽标、品牌视觉资产和专业排版。
  • 视频创作:增强视频编辑功能,生成高质量头像和动画效果。
  • 教育与内容创作:生成教学插图和创意内容,辅助教育和创作。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部