正在加载文章...

分享这篇文章

继续阅读

Codex 如何使用 GPT Image 2 生成项目图片

快速结论

当你需要真正的位图素材时，例如博客封面、Hero 图、产品场景图、缩略图、贴图或社交分享图，可以让 Codex 生成图片。关键流程是：写清提示词，检查结果，把最终图片保存进项目目录，再更新页面引用，不能让线上页面依赖临时生成目录。要想结果可复现，就固定一份站点图片规范，像管理代码一样管理生成图，版本化、检查、优化。

博文更新时间：2026-05-27。维护者：ToolOrbit Editorial Team。

Codex 适合把"设计意图"推进到"可落地资源"。你可以让它生成图片、检查画面、裁切转换、保存到仓库，并修改使用这张图的页面配置，所有这些都在同一次对话中完成。

OpenAI 的 GPT Image 2 模型文档是能力参考。落到 Codex 工作流时，可以先记住一个更实用的判断：普通项目图片优先走内置图片生成；只有明确需要模型级参数、批量脚本或 API/CLI 控制时，才切到命令行或接口路径。

了解 GPT Image 2 的能力边界

写提示词之前，先搞清楚模型擅长什么、不擅长什么，能避免大量返工。

擅长领域： GPT Image 2 在真实感场景、编辑类构图、实物表面产品模型、建筑和室内渲染、食物和生活摄影、抽象科技背景方面表现稳定。它能处理光线、景深和材质纹理。用于博客封面、Hero 区域和营销素材时，适合做原创构图。

薄弱领域： 模型在图像内精确渲染文字方面仍然吃力。生成的文字经常出现拼写错误、间距异常或笔画瑕疵。它也不擅长精确复制 UI，仪表盘截图或特定按钮样式无法做到像素级匹配。包含复杂空间关系的多主体场景，结果可能不一致。

分辨率和格式： 生成图通常输出高分辨率，但具体尺寸取决于你要求的宽高比。正方形（1:1）、横版（16:9）和竖版（3:4）支持较好。每次都应该明确指定比例，不要依赖默认值。

风格范围： 模型支持的风格词汇很广：编辑摄影、3D 渲染、扁平插画、等距视角、水彩、线稿、赛博朋克、极简主义等等。关键是要明确，"真实感编辑类桌面场景"和"开发者工作区的 3D 等距插画"会产生截然不同的结果。

什么场景适合生成图片？

适合生成的是位图资产，比如博客封面、Open Graph 图、商品展示场景、引导页插画、演示背景、电商运营桌面图和营销缩略图。

不适合生成的是应该保持可编辑、可访问、可复用的界面元素。图标、简单示意图、UI 控件、图表骨架和线框图通常应该用 SVG、HTML/CSS 或组件代码实现。

在 ToolOrbit 这类工具站里，可以这样分工：

博客和落地页图片：用 Codex 生成，再保存为优化后的 JPG 或 WebP。
UI 控件、图标和布局：用代码实现。
提示词草稿：用 AI 提示词生成器辅助整理。
最终图片处理：用图片压缩工具和图片格式转换工具优化。

位图 vs 矢量：先做判断

这个判断值得单独说明，因为它能避免大量返工。如果一个素材可以用形状、路径和颜色来描述，比如图标、示意图、图表，就用代码或 SVG 实现。结果将是分辨率无关、可访问、易修改的。

如果素材依赖摄影、材质、光线或有机构图，比如 Hero 图、产品场景、情绪板，生成是更好的路径。生成图本质上是位图，一开始就接受这个限制。

什么时候图库照片更合适

有些项目场景下，授权图库照片仍然是正确答案。如果你需要可识别的地标建筑、带有精确品牌信息的产品图，或者要面对法律审查的图片，使用图库服务。生成图适合原创构图，但并非在所有场景下都能替代有授权的、可溯源的摄影作品。

import Image from 'next/image';
import coverImg from '@/public/images/articles/cover.jpg';

<Image src={coverImg} alt="博客封面" width={1200} height={675} priority />

或者直接引用 public 目录路径：

<Image src="/images/articles/cover.jpg" alt="博客封面" width={1200} height={675} />

原生 HTML 或静态站点： 图片放在 images/ 或 assets/ 目录，用相对路径或根相对路径引用。<img> 标签要加上明确的 width 和 height 属性，防止加载时的布局偏移。

React（Vite 或 CRA）： 在组件文件顶部 import 图片，打包工具会处理哈希和优化。

import coverImg from './assets/blog-cover.jpg';

<img src={coverImg} alt="博客封面" width={1200} height={675} loading="lazy" />

更新博客元数据

在 ToolOrbit 及类似站点中，博客图片往往存储在数据文件中，而不是直接写在组件里。保存图片后，更新对应条目：

{
  slug: 'codex-gpt-image-2-workflow',
  title: 'Codex 如何使用 GPT Image 2 生成项目图片',
  // ...
}

如果站点支持 Open Graph 图片，生成并保存一张单独的 1200x630 OG 版本。

裁切和格式要有标准

生成图通常比页面需要的尺寸更大。保存前应该裁切到实际展示比例。博客封面常用 1200 x 675 的 16:9 尺寸。摄影类封面适合 JPG；扁平图形或截图适合 PNG；站点支持时也可以输出 WebP。

转换后要检查最终图片，而不是只看原始生成图。裁切可能会把主体裁掉，压缩也可能让小界面细节变糊。

格式选择矩阵

格式	最适合	避免用于
JPG	摄影封面、Hero 图、含渐变的场景	截图、文字密集图、扁平图形
PNG	截图、示意图、含文字图片、扁平插画	大幅摄影图片
WebP	浏览器兼容性良好的现代生产站点	老旧邮件客户端、旧版 CMS
AVIF	需要最佳压缩率的新一代站点	不支持 AVIF 解码的环境

各场景推荐分辨率

使用场景	推荐尺寸	宽高比
博客卡片缩略图	800 x 450	16:9
博客主图 / 页头	1200 x 675	16:9
Open Graph 图	1200 x 630	~1.91:1
方形社交帖子	1080 x 1080	1:1
产品场景图	1200 x 1200	1:1
Twitter 卡片	1200 x 600	2:1
全宽 Hero	1920 x 1080	16:9

始终生成不低于目标分辨率的图，然后缩小。把小图放大只会得到模糊的结果，而从大图缩小可以保留细节。

优化流水线

一条实用的博客封面优化流水线：

要求 Codex 生成高分辨率图片（如 16:9）。
检查原始输出，确认构图和主体无误。
用图片工具或 Codex 本身裁切到 1200x675。
转换为目标格式（照片类用 JPG，85% 质量是良好默认值）。
可选：为支持 WebP 的浏览器额外生成一份 WebP。
将两个版本都用图片压缩工具做最终体积优化。
保存到 public/images/articles/。

一个稳定的 Codex 迭代流程

推荐流程很短：

生成一张目标明确的图片。
视觉检查。
如果接近要求，只做一个明确调整。
把认可版本保存进项目。
更新页面引用。
验证页面或数据源。

不要一开始就生成很多方向完全不同的图。问题如果是"太像 3D 插画"，就直接要求真实摄影风格；问题如果是"和现有博客封面不搭"，就提供参考截图或描述共同元素。

有效的迭代提示词

模糊反馈会让修改方向发散，具体反馈更容易得到可控结果。对比一下：

弱："让它好看一点。" → 随机风格变化。
强："光线太平面了，从左上角加入暖色主光，加深阴影。" → 具体的光线调整。
弱："构图感觉不对。" → 模型猜你要改什么。
强："把笔记本电脑移到画面左侧三分之一处，右侧增加留白空间。" → 明确的空间指令。
弱："让它更专业。" → 方向不明确。
强："饱和度降低 30%，去掉装饰元素，桌面换成干净的白色表面，不要木纹。" → 可执行的约束。

核心模式一致：先识别具体症状，再命名修正方案，保持其他条件不变。摄影师和美术指导就是这样给修改意见的，模型对这种沟通方式响应最好。

重来还是迭代？

如果第一张图的生成方向根本不对，主题错误、风格错误、构图错误，就重写提示词重新生成。在坏的基础上迭代浪费时间，且模型可能难以跳出初始构图。

如果第一张图接近目标，只是有具体问题，光线、色偏、某个物体位置不对，用有针对性的反馈迭代。一到两轮修改是正常的，超过三轮通常说明初始提示词需要重新思考。

批量图片工作流

如果项目需要多张图片（博客系列、工具页插图组、分类页头图组），批量工作流可以节省时间并确保视觉统一。

先定义批量规格

在生成任何图片之前，先写下：

共享的风格约束（光线、色彩、主体距离、氛围）。
每张图片的场景描述。
共享的负面约束。
所有图片的目标格式和分辨率。

一份批量规格可能长这样：

系列：开发者工具分类页头（6 张）
共享风格：编辑类科技摄影，深海军蓝配暖琥珀色点缀，真实感光线，浅景深。
共享约束：无清晰文字，无 logo，无 3D 渲染，无人脸。
格式：1200x675 JPG，85% 质量。

1. JSON 工具：结构化数据在深色屏幕上发光的特写。
2. 图片工具：干净桌面上的相机镜头和色卡。
3. 安全工具：由电路轨迹构成的抽象锁形图标。
4. 文本工具：放在手写编辑标记上的钢笔。
5. 编码工具：汇聚成一条线的抽象数据流。
6. PDF 工具：带有细微网格和页边距参考线的文档版面。

逐张按照共享约束生成。一次生成一张、使用相同的风格描述，比在一个提示词里要求六张图更稳定。

批量输出的命名规范

使用可预测、可排序的文件名，让图片之间的关系一目了然：

category-header-json.jpg
category-header-image.jpg
category-header-security.jpg
category-header-text.jpg
category-header-encoding.jpg
category-header-pdf.jpg

这样既容易发现遗漏，也方便批量更新引用。

常见生成问题排查

图片"AI 味"太重

这是最常见的抱怨，通常来自以下几个根源：

光线过于干净： 要求"自然光线，细微的不规则阴影，真实的材质细节"。
塑料感表面： 添加"真实感纹理，表面颗粒，自然使用痕迹"。
构图过于模板化： 加入具体构图规则："三分法构图，主体放在左侧三分之一，从右下角引入引导线"。
色彩饱和度过高： 要求"柔和色调，饱和度降低 20%，编辑类调色"。

主体被错误裁切

如果主体被切断或位置不对，通常是宽高比和主体位置冲突。尝试："让主体居中，四周保留充足留白"或"使用更宽的构图，主体仅占据画面中央 60%"。

图片与站点现有风格不匹配

这是已有项目中最常见的问题。解决办法是创建一份可复用的风格提示词，存放在项目的贡献文档或共享笔记中：

ToolOrbit 博客封面风格规范：
- 16:9 宽高比，最终尺寸 1200x675。
- 编辑类科技摄影，非插画或 3D。
- 深海军蓝背景，配单一点缀暖色（琥珀或铜色）。
- 一个与文章主题相关的焦点物体。
- 浅景深，虚化背景。
- 无文字，无 logo，无人脸，无卡通元素。

把这份规范分享给所有为项目生成图片的人。一致性来自约束，而不是每次都重新描述风格。

生成失败或报错

如果 Codex 报告图片生成不可用或返回错误：

检查当前会话的模型端点是否支持图片生成。
简化提示词，过长或过于复杂的提示词有时会导致失败。
移除可能触发安全过滤的特定词汇。
如果内置路径不可用，尝试通过 API 路径作为备选。

常见坑

第一，把生成图当作 UI 使用。生成出来的工具栏可能看起来像界面，但它不可访问、不可响应、不可选择，也不好维护。UI 应该用代码实现。

第二，封面里出现假文字。它会降低质感，也容易让用户分心。可以要求模糊屏幕、抽象文档或图标化形状。

第三，只看大图，不看卡片尺寸。全尺寸很好看的封面，缩成博客卡片后可能过于嘈杂。上线前一定在实际展示尺寸下预览。

第四，没有保留原始输出。最终转换图确认前，原图最好先留着，方便重新裁切或压缩。硬盘空间很便宜，重新生成一张"差一点就满意"的图很贵。

第五，全站风格不统一。如果三张博客封面用编辑摄影风格，第四张突然变成扁平插画，整体系列感就碎了。定义一份风格规范然后坚持用它。

第六，忘了做 Open Graph 版本。一张为 16:9 Hero 区优化的博客封面，分享到社交媒体时会被尴尬地裁切。单独生成一张 1200x630 的 OG 图，或者确保主图同时适配两种比例。

在 ToolOrbit 里的用法

Codex 图片生成最适合提升内容呈现。可以先用 AI 提示词生成器整理提示词，再用图片压缩工具降低体积，用图片格式转换工具输出页面需要的格式。

对颜色敏感的工作，可以用配色生成器定义风格规范的调色板，用取色器从参考图中采样颜色。

如果你要长期生产内容，最好固定一份站点图片规范：比例、光线、色彩、主体、禁止风格和保存路径。规范越稳定，后面就越少出现"封面不搭"的返工。

总结

Codex 配合 GPT Image 2 使用时，最好把图片生成当作工程流程。写具体的提示词，带明确约束。把成品保存进有版本管理的项目路径。按实际展示尺寸优化。用有针对性的反馈做迭代，减少随机重新生成。记录一份风格规范，让项目图片保持统一。团队应建立可重复的流程，持续产出可上线的素材，而不是把时间花在追求单张图片没有瑕疵上。

正在加载文章...

分享这篇文章

返回全部文章

继续阅读

Codex 如何使用 GPT Image 2 生成项目图片

快速结论

博文更新时间：2026-05-27。维护者：ToolOrbit Editorial Team。

了解 GPT Image 2 的能力边界

写提示词之前，先搞清楚模型擅长什么、不擅长什么，能避免大量返工。

什么场景适合生成图片？

适合生成的是位图资产，比如博客封面、Open Graph 图、商品展示场景、引导页插画、演示背景、电商运营桌面图和营销缩略图。

在 ToolOrbit 这类工具站里，可以这样分工：

博客和落地页图片：用 Codex 生成，再保存为优化后的 JPG 或 WebP。
UI 控件、图标和布局：用代码实现。
提示词草稿：用 AI 提示词生成器辅助整理。
最终图片处理：用图片压缩工具和图片格式转换工具优化。

位图 vs 矢量：先做判断

如果素材依赖摄影、材质、光线或有机构图，比如 Hero 图、产品场景、情绪板，生成是更好的路径。生成图本质上是位图，一开始就接受这个限制。

什么时候图库照片更合适

或者直接引用 public 目录路径：

<Image src="/images/articles/cover.jpg" alt="博客封面" width={1200} height={675} />

React（Vite 或 CRA）： 在组件文件顶部 import 图片，打包工具会处理哈希和优化。

import coverImg from './assets/blog-cover.jpg';

<img src={coverImg} alt="博客封面" width={1200} height={675} loading="lazy" />

更新博客元数据

在 ToolOrbit 及类似站点中，博客图片往往存储在数据文件中，而不是直接写在组件里。保存图片后，更新对应条目：

{
  slug: 'codex-gpt-image-2-workflow',
  title: 'Codex 如何使用 GPT Image 2 生成项目图片',
  // ...
}

如果站点支持 Open Graph 图片，生成并保存一张单独的 1200x630 OG 版本。

裁切和格式要有标准

转换后要检查最终图片，而不是只看原始生成图。裁切可能会把主体裁掉，压缩也可能让小界面细节变糊。

格式选择矩阵

格式	最适合	避免用于
JPG	摄影封面、Hero 图、含渐变的场景	截图、文字密集图、扁平图形
PNG	截图、示意图、含文字图片、扁平插画	大幅摄影图片
WebP	浏览器兼容性良好的现代生产站点	老旧邮件客户端、旧版 CMS
AVIF	需要最佳压缩率的新一代站点	不支持 AVIF 解码的环境

各场景推荐分辨率

使用场景	推荐尺寸	宽高比
博客卡片缩略图	800 x 450	16:9
博客主图 / 页头	1200 x 675	16:9
Open Graph 图	1200 x 630	~1.91:1
方形社交帖子	1080 x 1080	1:1
产品场景图	1200 x 1200	1:1
Twitter 卡片	1200 x 600	2:1
全宽 Hero	1920 x 1080	16:9

始终生成不低于目标分辨率的图，然后缩小。把小图放大只会得到模糊的结果，而从大图缩小可以保留细节。

优化流水线

一条实用的博客封面优化流水线：

要求 Codex 生成高分辨率图片（如 16:9）。
检查原始输出，确认构图和主体无误。
用图片工具或 Codex 本身裁切到 1200x675。
转换为目标格式（照片类用 JPG，85% 质量是良好默认值）。
可选：为支持 WebP 的浏览器额外生成一份 WebP。
将两个版本都用图片压缩工具做最终体积优化。
保存到 public/images/articles/。

一个稳定的 Codex 迭代流程

推荐流程很短：

生成一张目标明确的图片。
视觉检查。
如果接近要求，只做一个明确调整。
把认可版本保存进项目。
更新页面引用。
验证页面或数据源。

有效的迭代提示词

模糊反馈会让修改方向发散，具体反馈更容易得到可控结果。对比一下：

弱："让它好看一点。" → 随机风格变化。
强："光线太平面了，从左上角加入暖色主光，加深阴影。" → 具体的光线调整。
弱："构图感觉不对。" → 模型猜你要改什么。
强："把笔记本电脑移到画面左侧三分之一处，右侧增加留白空间。" → 明确的空间指令。
弱："让它更专业。" → 方向不明确。
强："饱和度降低 30%，去掉装饰元素，桌面换成干净的白色表面，不要木纹。" → 可执行的约束。

核心模式一致：先识别具体症状，再命名修正方案，保持其他条件不变。摄影师和美术指导就是这样给修改意见的，模型对这种沟通方式响应最好。

重来还是迭代？

批量图片工作流

如果项目需要多张图片（博客系列、工具页插图组、分类页头图组），批量工作流可以节省时间并确保视觉统一。

先定义批量规格

在生成任何图片之前，先写下：

共享的风格约束（光线、色彩、主体距离、氛围）。
每张图片的场景描述。
共享的负面约束。
所有图片的目标格式和分辨率。

一份批量规格可能长这样：

系列：开发者工具分类页头（6 张）
共享风格：编辑类科技摄影，深海军蓝配暖琥珀色点缀，真实感光线，浅景深。
共享约束：无清晰文字，无 logo，无 3D 渲染，无人脸。
格式：1200x675 JPG，85% 质量。

1. JSON 工具：结构化数据在深色屏幕上发光的特写。
2. 图片工具：干净桌面上的相机镜头和色卡。
3. 安全工具：由电路轨迹构成的抽象锁形图标。
4. 文本工具：放在手写编辑标记上的钢笔。
5. 编码工具：汇聚成一条线的抽象数据流。
6. PDF 工具：带有细微网格和页边距参考线的文档版面。

逐张按照共享约束生成。一次生成一张、使用相同的风格描述，比在一个提示词里要求六张图更稳定。

批量输出的命名规范

使用可预测、可排序的文件名，让图片之间的关系一目了然：

category-header-json.jpg
category-header-image.jpg
category-header-security.jpg
category-header-text.jpg
category-header-encoding.jpg
category-header-pdf.jpg

这样既容易发现遗漏，也方便批量更新引用。

常见生成问题排查

图片"AI 味"太重

这是最常见的抱怨，通常来自以下几个根源：

光线过于干净： 要求"自然光线，细微的不规则阴影，真实的材质细节"。
塑料感表面： 添加"真实感纹理，表面颗粒，自然使用痕迹"。
构图过于模板化： 加入具体构图规则："三分法构图，主体放在左侧三分之一，从右下角引入引导线"。
色彩饱和度过高： 要求"柔和色调，饱和度降低 20%，编辑类调色"。

主体被错误裁切

如果主体被切断或位置不对，通常是宽高比和主体位置冲突。尝试："让主体居中，四周保留充足留白"或"使用更宽的构图，主体仅占据画面中央 60%"。

图片与站点现有风格不匹配

这是已有项目中最常见的问题。解决办法是创建一份可复用的风格提示词，存放在项目的贡献文档或共享笔记中：

ToolOrbit 博客封面风格规范：
- 16:9 宽高比，最终尺寸 1200x675。
- 编辑类科技摄影，非插画或 3D。
- 深海军蓝背景，配单一点缀暖色（琥珀或铜色）。
- 一个与文章主题相关的焦点物体。
- 浅景深，虚化背景。
- 无文字，无 logo，无人脸，无卡通元素。

把这份规范分享给所有为项目生成图片的人。一致性来自约束，而不是每次都重新描述风格。

生成失败或报错

如果 Codex 报告图片生成不可用或返回错误：

检查当前会话的模型端点是否支持图片生成。
简化提示词，过长或过于复杂的提示词有时会导致失败。
移除可能触发安全过滤的特定词汇。
如果内置路径不可用，尝试通过 API 路径作为备选。

常见坑

第一，把生成图当作 UI 使用。生成出来的工具栏可能看起来像界面，但它不可访问、不可响应、不可选择，也不好维护。UI 应该用代码实现。

第二，封面里出现假文字。它会降低质感，也容易让用户分心。可以要求模糊屏幕、抽象文档或图标化形状。

第三，只看大图，不看卡片尺寸。全尺寸很好看的封面，缩成博客卡片后可能过于嘈杂。上线前一定在实际展示尺寸下预览。

第四，没有保留原始输出。最终转换图确认前，原图最好先留着，方便重新裁切或压缩。硬盘空间很便宜，重新生成一张"差一点就满意"的图很贵。

第五，全站风格不统一。如果三张博客封面用编辑摄影风格，第四张突然变成扁平插画，整体系列感就碎了。定义一份风格规范然后坚持用它。

在 ToolOrbit 里的用法

Codex 图片生成最适合提升内容呈现。可以先用 AI 提示词生成器整理提示词，再用图片压缩工具降低体积，用图片格式转换工具输出页面需要的格式。

对颜色敏感的工作，可以用配色生成器定义风格规范的调色板，用取色器从参考图中采样颜色。

相关文章推荐

7 个关键洞察：AI Coding 工具真正改变的不是写代码，而是验证代码

Claude Code 配置指南：先把这 7 件事配好

Codex CLI 实用配置指南：先把这 6 件事配好，再开始让它写代码

Codex 如何使用 GPT Image 2 生成项目图片

快速结论

了解 GPT Image 2 的能力边界

什么场景适合生成图片？

位图 vs 矢量：先做判断

什么时候图库照片更合适

推荐的提示词结构

每个组成部分为什么重要

更多提示词示例

必须保存到项目目录

不同框架的集成方式

更新博客元数据

裁切和格式要有标准

格式选择矩阵

各场景推荐分辨率

优化流水线

一个稳定的 Codex 迭代流程

有效的迭代提示词

重来还是迭代？

批量图片工作流

先定义批量规格

批量输出的命名规范

常见生成问题排查

图片"AI 味"太重

主体被错误裁切

图片与站点现有风格不匹配

生成失败或报错

常见坑

在 ToolOrbit 里的用法

总结

相关文章推荐

7 个关键洞察：AI Coding 工具真正改变的不是写代码，而是验证代码

Claude Code 配置指南：先把这 7 件事配好

Codex CLI 实用配置指南：先把这 6 件事配好，再开始让它写代码

Codex 如何使用 GPT Image 2 生成项目图片

快速结论

了解 GPT Image 2 的能力边界

什么场景适合生成图片？

位图 vs 矢量：先做判断

什么时候图库照片更合适

推荐的提示词结构

每个组成部分为什么重要

更多提示词示例

必须保存到项目目录

不同框架的集成方式

更新博客元数据

裁切和格式要有标准

格式选择矩阵

各场景推荐分辨率

优化流水线

一个稳定的 Codex 迭代流程

有效的迭代提示词

重来还是迭代？

批量图片工作流

先定义批量规格

批量输出的命名规范

常见生成问题排查

图片"AI 味"太重

主体被错误裁切

图片与站点现有风格不匹配

生成失败或报错

常见坑

在 ToolOrbit 里的用法

总结