ai绘画是怎么画的?ai绘画算法揭秘 - AI绘画每日一帖

"

AI 绘画通过CLIP技术建立「文字潜在空间」到「图片潜在空间」的对应关系,并通过 Diffusion 技术从一张噪点图得到一张有信息的高清图。

一文讲透ai作画原理技术 一文中,我们介绍了ai绘画的基本原理,这背后更详细的ai绘画算法是什么?ai作画到底是怎么画的?今天就给大家揭秘 ~

CLIP ~ 众里寻她千百度

如果让你把左侧三张图和右侧三句话配对,你可以轻松完成这个连线。但对 AI 来说,图片就是一系列像素点,文本就是一串字符,要完成这个工作可不简单。

这需要 AI 在海量「文本-图片」数据上学习图片和文本的匹配。图中绿色方块是「图片潜在空间」的 N 张图片,紫色方块是「文本潜在空间」的 N 句描述语。AI 会努力将对应的 I1 与 T1 (蓝色方块)匹配,而不是 I2 与 T3 (灰色方块)匹配。这个 AI 就是广泛被用在 AI 作画中的 CLIP(Contrastive Language-Image Pre-Training / 对比式语言-文字预训练)。

当 AI 能成功完成这个连线,也就意味着 AI 建立了「文字潜在空间」到「图片潜在空间」的对应关系。这就是上一回中之所以 AI 能根据提示语 "一只骑摩托车的大熊猫" 找到「图片潜在空间」中对应(图片)点的原因。

图片:"我散开了" ~ Diffusion 的自白

从图片潜在空间中的一个点得到一张高清图片,相当于给你一个身份证号让你在全国 14 亿人中找到这个人,难度可想而知。

对 AI 来说,过去大家熟知一些 AI 图像生成的项目主要使用了 GAN 技术(Generative Adversarial Network 生成对抗网络),在 ai绘画是什么意思?什么是ai绘画? 中两个例子都是通过 GAN 生成的。但 GAN 的一大缺陷是不好加条件,比如 AI 只知道要生成人脸,但没法儿指定让 AI 生成黑长直美女头像。

为了让 AI 听懂人话,Diffusion (扩散)技术逐渐成为 AI 生成图像领域的新宠。如何理解 Diffusion 技术?Diffusion 来自一个物理现象:当我们把墨汁滴入水中,墨汁会均匀散开;这个过程一般不能逆转,那 AI 可以做到么?(AI:我太难了)

当墨汁刚滴入水中时,我们能区分哪里是墨哪里是水,信息是非常集中的;当墨汁扩散开来,墨和水就难分彼此了,信息是分散的。类比于图片,这个墨汁扩散的过程就是图片逐渐变成噪点的过程:从信息集中的图片变成信息分散、没有信息的噪点图很简单,逆转这个过程就需要 AI 的加持了。

研究人员对图片加噪点,让图片逐渐变成纯噪点图;再让 AI 学习这个过程的逆过程,也就是如何从一张噪点图得到一张有信息的高清图。

跟 GAN 相比,Diffusion 是可以加条件的,也就是我们指定 AI 生成图片时描述的那句话。依靠这样的学习,AI 就实现了我们看到的一句话生成图片的惊艳效果。

图片引用

相关推荐
板面华仔8 分钟前
机器学习入门(三)——决策树(Decision Tree)
人工智能·决策树·机器学习
GAOJ_K21 分钟前
滚珠花键的无预压、间隙调整与过盈配合“场景适配型”
人工智能·科技·机器人·自动化·制造
ai_xiaogui25 分钟前
【开源探索】Panelai:重新定义AI服务器管理面板,助力团队私有化算力部署与模型运维
人工智能·开源·私有化部署·docker容器化·panelai·ai服务器管理面板·comfyui集群管理
源于花海30 分钟前
迁移学习的前沿知识(AI与人类经验结合、传递式、终身、在线、强化、可解释性等)
人工智能·机器学习·迁移学习·迁移学习前沿
king of code porter1 小时前
百宝箱企业版搭建智能体应用-平台概述
人工智能·大模型·智能体
愚公搬代码1 小时前
【愚公系列】《AI短视频创作一本通》004-AI短视频的准备工作(创作AI短视频的基本流程)
人工智能·音视频
物联网软硬件开发-轨物科技1 小时前
【轨物洞见】告别“被动维修”!预测性运维如何重塑老旧电站的资产价值?
运维·人工智能
电商API_180079052471 小时前
第三方淘宝商品详情 API 全维度调用指南:从技术对接到生产落地
java·大数据·前端·数据库·人工智能·网络爬虫
梁辰兴1 小时前
百亿美元赌注变数,AI军备竞赛迎来转折点?
人工智能·ai·大模型·openai·英伟达·梁辰兴·ai军备竞赛
PaperRed ai写作降重助手1 小时前
智能写作ai论文生成软件推荐
人工智能·aigc·ai写作·智能降重·paperred