DALL·E 3

简介

DALL·E 3是OpenAI推出的第三代文本生成图像AI模型，能够根据自然语言描述生成高质量、细节丰富的图像。相比前代，DALL·E 3在文本理解能力、图像一致性和创作自由度上均有显著提升，尤其擅长处理复杂场景描述和生成艺术风格作品。其核心技术通过改进训练数据集的文本描述质量，结合扩散模型与T5-XXL编码器，实现了对用户意图的精准捕捉。

特点

1. 高级文本理解：DALL·E 3能解析包含物体数量、位置、颜色及场景细节的长文本提示，生成高度匹配描述的图像，例如“夕阳下未来城市的飞行汽车”或“戴眼镜的熊猫角色三视图”。

2. 多风格支持：支持自然（写实）与生动（超现实）两种生成模式，用户可灵活调整画面风格。

3. 高分辨率输出：默认生成1024×1024像素图像，支持1792×1024和1024×1792宽高比，适用于横幅设计或手机壁纸。

4. 安全过滤系统：内置内容审核机制，避免生成涉及暴力、侵权等违规内容。

如何使用

1. 通过ChatGPT交互：ChatGPT Plus用户可直接在对话中描述需求，AI会自动优化提示词并生成图像。

2. API调用：开发者可通过OpenAI API发送JSON请求，指定提示词、尺寸（如1024x1024）、生成数量（n=1）等参数。

3. Bing Image Creator：非付费用户可通过微软Bing平台免费体验基础功能，生成速度受额度限制。

价格

1. ChatGPT Plus订阅：20美元/月，包含DALL·E 3基础生成额度，超出后按0.04美元/张计费。

2. 企业API：按调用次数计费，1024×1024分辨率图像约0.08美元/张，支持批量请求折扣。