现在的文生图模型实在是太变态了。
事情是这样的。
前几天,写了一篇观点类文章《以后,我们也许就不再"读"代码了 - 掘金》。
由于文章是纯理论,全文没有一张截图,导致文章看起来有些单调了。
于是,我就想着试试"即梦AI"能不能直接帮我配上几个插图,让文章图文并茂,看起来不那么呆板。
之前,需要配图时,我都是手动选择一部分文字给"即梦AI",让它根据这段文字生成图片。
每次使用,一篇文章都要分开数次选择、复制、粘贴,也挺麻烦的。于是,那天,我直接把全文复制给了"即梦AI"。

下图是当时的全部提示词。

生成结果出来之后,真的给我惊呆了。
首先,在没有指定几张配图的情况下,"即梦AI"准确识别了两个实例的关键语句和最终结论,配图位置理解非常到位。
其次,前两张图的对比构图完美地戳到了我的表达意愿。
当然,生成也不是 100% 完美,但都是些小瑕疵,并且可以很方便优化。
- 第二张配图左下方有多余的文字,通过"即梦AI"的"消除笔"功能直接就擦出了。
- 第三张图片中 3 个图标图文不太对应,一个指令也就优化了。

要知道,文生图才发布2年左右,AI 的进步真的可以说是日新月异了。