Ovis-Image：卓越的图像生成模型

你是否还在为无法得到自己心中想要的画面发愁？直到现在 ai 生成的图片也会有很多槽点，比如文字乱码想在 T 恤上印「LOVE」，结果出来的是 ℒℴ𝒱 外星文，放大一看全是伪笔画，又或者是常识错误，猫耳朵长到头顶正中间，汽车轮子比车身还大，咖啡杯没有底，物理老师沉默，生物老师落泪，除了这些还有风格漂移，乱打光影甚至多写几句，它又自动忽略后半截，像跟健忘症患者对话。

但是现在由 AIDC-AI 团队发布了 Ovis-Image 模型解决了大部分问题，它采用多尺度 Transformer 编码器与自回归生成架构，在高分辨率图像生成、细节表现及多风格适配能力上表现卓越。优化了噪声采样和 classifier-free guidance 技术使 Ovis-Image 能够在 1024x1024 分辨率下生成自然、连贯、细节丰富的图像，并且可以生成各种不同的风格图片，从写实到动漫、从科幻到中古风多风格泛化能力极强。

更可夸的是它的可控生成能力强，可以通过 Guidance Scale、采样步数、分辨率与随机种子实现精细可控生成，也就是说不怕同样的描述生成两张几乎一样的图片。

无论对于长期使用的设计者还是想短暂使用生图的普通人都可以用 Ovis-Image 做出自己真正想要的图片。

教程链接： https://go.openbayes.com/GvGzD

使用云平台: OpenBayes

http://openbayes.com/console/signup?r=sony_0m6v

首先点击「公共教程」，找到「 Ovis-Image：高质量图像生成模型」，单击打开。