文章目录
随着人工智能生成内容(AIGC)技术的飞速发展,越来越多的行业开始关注其在实际应用中的潜力和价值。特别是在图像生成领域,文生图(Text-to-Image)技术在内容创作和设计领域中的应用逐渐成为热点。本文将以蓝耘元生代部署通义万相2.1文生图为主题,探讨其工作原理、应用场景以及如何帮助企业和个人提高创作效率和效果。
👏什么是文生图?
文生图(Text-to-Image)是一种基于自然语言处理(NLP)和计算机视觉(CV)的技术,能够将用户输入的文本描述转化为逼真的图像。随着深度学习的进步,现今的文生图技术不仅能生成常见的物体和场景,还能创作出更加复杂和具有创意的图像。这种技术广泛应用于广告设计、游戏美术、影视制作等行业,极大地提升了创作的效率和创新的空间。
👏通义万相2.1文生图
2月25日晚间,阿里巴巴宣布,阿里云视频生成大模型万相2.1(Wan)开源 。此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。
通义万相是阿里云通义系列AI绘画创作大模型,可辅助人类进行图片创作,于2023年7月7日正式上线。今年1月初,通义万相视频生成模型宣布升级至2.1版,凭借着优秀的表现,在权威评测榜单VBench中登上榜首。
文章节选:https://baijiahao.baidu.com/s?id=1825090784124063537\&wfr=spider\&for=pc
👏蓝耘元生代部署通义万相2.1
👏平台注册
我们在实现之后文生图,首先注册一下
注册链接:https://cloud.lanyun.net/#/registerPage?promoterCode=5b9e82cbb1
注册之后,我们就可以来到主页面了
这样我们就完成平台的注册了
👏部署通义万相2.1
部署通义万相2.1我们点击平台的应用市场
下方的页面就说明我们成功进去了,同时平台给我们操作说明
1)在页面左侧输入关键词。可以在下面切换中英文(CH/EN)
2)点击关键词下面的Prompt Enhance按钮,几分钟后生成更加丰富的提示词。
3)在页面左下方点击Generate Image按钮,几分钟后生成图像在页面右侧。
-
Diffusion Step: 这是扩散模型中的步骤,用于逐步去除噪声,将随机噪声图像转变为清晰的目标图像。每个步骤都帮助模型逐渐恢复原始数据。
-
Shift Scale: 这个操作用于调整图像的亮度和对比度。Shift 改变图像的亮度,Scale 则调整图像的对比度,帮助图像适应特定的视觉效果。
-
Guide Scale: 在条件生成模型中,这个参数控制生成图像与特定条件(如文本描述)之间的匹配度。较大的 guide scale 会让图像更加符合给定的条件,较小的 guide scale 会让生成图像更具随机性。
👏使用通义万相2.1文生图
接下来我们进行部署使用,点击右上角的部署按钮
计费方式、GPU型号等按自己需求,之后点击立即购买
接下来我们等待片刻,这时候正在创建,接下来我们点击快速启动应用
进入到正式的界面
接下来我们进行三组提示词的测试
第一组:
文生图结果:
第二组:
文生图结果:
第三组:
文生图结果:
以上是三组测试,欢迎更多的小伙伴展示自己的图片
【温馨提示】:使用完毕记得关机哦
👏提示词合集
C站大佬总结的【中文文档】Stable Diffusion 潜工具书(2023/12/22)感兴趣的可以访问一下~
https://civitai.com/articles/3465/stable-diffusion-20231222
https://docs.qq.com/doc/DWEpNdERNbnBRZWNL
👏总结
本文主要介绍了如何使用蓝耘元生代部署通义万相2.1文生图,并进行了三组测试,后两个生成的效果要明显高于第一组,这可能和提示词还有参数选择有关,但是从整体质量还有时间响应来看,通义万相2.1的一款优质的大模型,同时使用蓝耘元生代让你更加便捷的进行使用,感兴趣的小伙伴可以来试试~
注册链接:https://cloud.lanyun.net/#/registerPage?promoterCode=5b9e82cbb1