最近有重新设计下我的 AI 图片生成方式,这里分享下。
过去我的思路处理得非常简单,就是文章文案做完之后,用程序强制性将文章划分成几个段落,然后就这里面的每一个区块生成一张单独的图片。
但是这种做法有个几个问题。
一是这种强制性的划分会导致文章语义的分割,可能 A 区块描述的内容与 B 区块描述的内容基本一样,那 AI 生成出来的图片大差不差。
二是图片生成风格不一致,同一篇文章中的图片风格不一致,不同文章中的图片风格不一致。
这部分不一致是因为提示词的问题导致的,而且我自己在前期设计这套流程的时候也没注意这部分内容。
所以上个月就开始将这部分工作流进行重塑,着手去优化下这部分内容。
因为我的文章一般都不是很长(1500 左右),所以现在改造之后将整个生成流程分为两个部分,图片生成的 Prompt 提炼与图片生成。
首先将文章内容同步给模型 A,让其分析这篇文章并给出这篇文章适合配几张图片,并给我具体的图片场景。
这种图片场景的总结,是基于文章内容的提炼,且需要在「内容总结提炼 Prompt」里做好提前约定。
等上一步处理完,就需要做风格统一了,一般做法就是将上一步骤中的场景提炼与我们的的风格预定文案进行组合,生成正对性的图片生成 Prompt 了。
到这里大致工作便做完了,剩下就是将 Prompt 发送给图片生成模型并获取生成的图片内容了。
这套流程我自己体验下来的效果还不错,可能是因为我的网站中所需要使用的图片没那么强艺术感的缘故,所以这套流程应付我当前的工作需求没什么问题。
如果后续需要做其他的升级,后面可以再进行针对性优化。






