我用 GPT-4o 创作属于我自己的丁丁漫画

作者:萨姆·瓦塞吉

比利时------鲁汶-拉-讷夫------埃尔热博物馆(法国建筑师克里斯蒂安·德·波尔赞帕克设计------2009年------截至2024年仍在运营。)CC许可,来源。

也许你们有些人认识我是科普作家,或许在我的一些文章里,特别是关于人工智能的主题上,你们能感受到一些未来主义的气息。实际上,我几乎总是更喜欢外出调查、探索,收集各种问题上的有趣事实,并努力围绕一个话题从不同角度编织引人入胜的叙事。所以,今天在这里,或许最让你意想不到的是,我要讲一个非常个人的故事,一个真正由内心驱动的内向者的故事,关于如何用人工智能去实现那些最特别、最难忘的童年梦想。

你难道从没梦想过,成为你最喜欢的漫画英雄的一员?或者自己续写心爱的英雄冒险故事,甚至创作你最喜欢的漫画续集?

"通过相信自己的梦想,人可以把它们变成现实。"------埃尔热

这篇文章将讲述丁丁,一个我在青少年时期极度痴迷的角色。我不仅非常喜欢乔治·普罗斯佩·雷米(艺名埃尔热)笔下那些惊险刺激的冒险故事,以及比利时-法国风情的欧洲漫画;更重要的是,这些角色真正融入了我的日常生活,仿佛是我的想象中的灵魂伙伴。后来,十七岁那年,当我像在丁丁故事里一样,逃离了伊朗的穆拉政权,在南美、加拿大和欧洲之间流浪、没有护照地漂泊时,这些漫画依然陪伴着我。我靠它们学习语言,在德语、英语、法语、阿拉伯语、西班牙语的练习中,丁丁成了我最好的帮手。

但是等等!现在发生了什么?------我刚刚发现,我可以用任何想要的语言,创作属于自己的丁丁漫画!这个想法是在几天前的一个清晨突然冒出来的。那时,看到吉卜力工作室引发的大热潮,我受到了冲击,于是给 GPT-4o 下了个提示:

【提示】我要一张丁丁漫画风格的图片,画一个男孩从房子里跑出来的场景。

结果,瞧!就是这样!第一个 GPT-丁丁诞生了。我立刻去冲了一杯早咖啡。------这是真的吗?我是在做梦吗?------是真的!

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

令人印象深刻!我继续想象丁丁要去哪里,我心里的小孩立刻大叫:"哇靠!萨姆!叫辆出租车去机场!快点!"于是我又在手机上发了一个提示:

【提示】画一张丁丁坐出租车飞速赶往机场的图片。窗外能看到其他车辆,远处隐约能看见机场。司机一边吃三明治一边开车。丁丁坐在后座,神情焦虑地望着外面。

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

"什么?已经到机场了?"小孩惊呼道,"快!赶上飞开罗的埃及航空航班!"下一步很清楚了:

【提示】画一张丁丁冲向一架老旧埃及航空飞机舷梯准备登机的场景。空姐在舷梯顶端等待。只看到丁丁从背后奔跑的样子。

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

"别忘了斯诺威!......哇!看那儿,金字塔!"当然,我怎么能忘:

【提示】画一张丁丁和斯诺威一起坐在飞机上,从窗外可以看到埃及金字塔的画面。

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

我知道,法老的陵墓一定出事了。"对!兄弟你懂的,但别担心,丁丁来了!"------我必须赶快去救法老:

【提示】画一张丁丁风格的漫画,画三名盗贼正在法老的墓穴里作案,丁丁藏身在他们身后。

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

小孩的声音兴奋地回响:"耶!他来了!......砰!咔嚓!"于是紧接着又下了一个提示:

【提示】画一张丁丁在法老墓穴里攻击三名盗贼的动作场景,画面中要有像'BOOM'和'ZACK'这样的动态文字。

拳头打得太狠了,结果其中一个盗贼------本来是秃头------居然突然长出了一头浓密的头发。或者,是太阳神拉施了魔法?

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

从最开始的脑爆到用提示生成出上面这些小故事,大概只花了二十分钟。但这种乐趣和成就感太大了,创造了我人生中第一个丁丁迷你漫画条,于是我立刻决定继续推进,哪怕只是作为一个绝对的业余爱好者,也要试着搭建一个用 GPT-4o 制作迷你漫画的生产线。想法很简单:一切由 GPT-4o 从零开始完成,看看最终能做到什么程度,以及它的极限在哪。GPT-4o负责建议故事、生成故事板、设计分镜、写出提示,最后生成图片。故事控制在十到十五个场景之间,每一段剧情从一个场景过渡到下一个场景,也可以后期进一步细化。即使对话是机器生成的,也可以稍后手动加进画面里。

"对话里是谎言,画面中是真相。"------凯莉·赖克哈特

所以,我打算作为一个纯业余者,设计一个简单的四步走小项目,测试用 GPT-4o 来制作迷你漫画条的基本流程。我的四个步骤是:

让我们开始吧。

GPT-4o提议了这样一个故事:

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

整个漫画作为原型条不会超过十三个场景,就像一个推介板。GPT-4o提出并生成的大纲如下:

第一步,十三个场景的故事板由 GPT-4o 生成,长这样:

第二步,根据故事板,GPT-4o 在同一轮次生成了对应的分镜,效果如下:

第三步,每个场景被转化成精确的提示,这些提示随后用于让 GPT-4o 在同一轮次逐个生成图像,举个例子,前两个提示是这样的:

用这些提示,在同一轮次里,一张一张地生成了漫画场景。最终,这就是一张包含十三个画面的漫画推介板。我把这些画面从左上到右下排成一张大图板。正如前面提到的,对话文本和场景描述是后来手动加上去的。

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

需要说明的是,本文中生成的所有图片仅作为教育示范用途,绝无商业化意图,符合合理使用规范。所有图片均为本人亲自提示并由 OpenAI 的 GPT-4o 生成,绝非从其他来源拷贝而来。禁止复制和传播本文中的图片。

不过,就像我们可以在家里自由地画出或雕刻自己童年英雄的形象一样,现在也可以用人工智能工具来创作属于自己的私人漫画。

从更广泛的角度来看,如果能够以某种漫画风格作为参考背景,我们可以搭建一个迷你制作流程,制作出属于自己的私人漫画合集。毫无疑问,在接下来的几年里,这项技术将大大提升,变得更加完美、快速。

为了让你们感受到这种颠覆性进步真的已经在路上,我在生成"小条幅漫画------《丁丁与拉神的回声》"的同一轮次,又追加了一个提示:

【提示】你在这次聊天中做得非常棒------从生成丁丁风格漫画的故事板,到绘制所有图片。现在我们该再迈进一步了。请创作一个全新的故事,只有五个场景。------首先,你自己内部规划好故事板和分镜,然后用提示来提示自己,最后一次性生成五个场景,并排从左到右排列成一张漫画条图像。------不要交付中间步骤,比如故事板或分镜描述,只交付包含五个场景插画的最终大图。

结果我很惊讶地发现,如果把期望管理得好,专注于一个只有五幕的小故事,现场就能出非常棒的效果------而且这次 GPT-4o 甚至直接在画面上自动加入了对话文字:

(图片由作者用 GPT-4o 提示生成,文章末尾有免责声明)

事实上,我们可以把更长的章节切成小模块,每个模块包含多个场景,然后分别生成,最后整合成完整的篇章。实际上,你可以自己写一个小故事,定义好风格,然后提示 AI 按模块化方式生成自己和孩子们想要的漫画条。

我并不确定未来是否需要专门的初创应用来制作这种家用漫画条,因为现在基础模型比如 GPT-4o 已经可以直接高效、舒适地完成这些工作了。而且,结果还可以用 Adobe Creative Cloud 之类的软件快速加工和优化,这些软件本身也都融入了 AI。

所以,我希望通过这个以我最爱的英雄丁丁为主角的小例子,能鼓励你们在家里也试着动手,给家人和朋友们创作自己喜欢的英雄漫画------漫画的新纪元已经开启了!

"万岁!万岁!世界末日被推迟了!"------埃尔热

相关推荐
yngsqq1 分钟前
CAD 像素点显示图片——CAD二次开发 OpenCV实现
人工智能·opencv·计算机视觉
Luke Ewin13 分钟前
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
老马啸西风1 小时前
AgentGPT 在浏览器中组装、配置和部署自主 AI 代理 入门介绍
人工智能·ai·openai·agent·robot·deepseek·mcp
京东零售技术1 小时前
京东3D空间视频生成技术探索与应用
人工智能
Jamence1 小时前
多模态大语言模型arxiv论文略读(十六)
人工智能·语言模型·自然语言处理
武汉唯众智创1 小时前
人工智能(机器人)通识实验室解决方案
人工智能·机器人·人工智能实验室·人工智能通识实验室·人工智能通识·机器人通识实验室·机器人实验室
巷9552 小时前
深入理解卷积神经网络(CNN):从原理到实践
人工智能·神经网络·cnn
知来者逆2 小时前
计算机视觉——基于MediaPipe实现人体姿态估计与不良动作检测
人工智能·深度学习·计算机视觉·mediapipe·姿态估计·人体姿态
满天星耶2 小时前
机器学习数据特征处理,鸢尾花案例,数字识别案例
图像处理·人工智能·机器学习·计算机视觉·数据分析·近邻算法