图像生成技术飞速发展,个人化艺术创造还有多远?

图像生成技术飞速发展,个人化艺术创造还有多远?

在当今这个创意与科技交织的时代,图像生成技术正以前所未有的速度重塑视觉艺术的边界。不管你是否有艺术细胞,不管你是否接受了系统的艺术创作教育,你都可以通过图像生成技术创造出属于你自己的艺术。

通义万相文本绘图与人像美化

在开始话题之前,我先点进去了话题中提供的体验链接:https://www.aliyun.com/solution/tech-solution/tongyi-wanxiang 最开始进去这个页面看着和通义万相感觉一点关系没有,后来再次确认了链接没有错,那么意思就是需要自己部署 【通义万相文本绘图与人像美化】 这个,然后再体验通义万相的文生图

在文档中找到部署操作的内容,这里我为了可以快速体验自己部署版的通义万相,我选择【一键部署】

进入一键部署后,部署步骤比较简单,按照部署步骤先准备账号和DashScope API-KEY ,然后点击 一键部署 到ROS控制台,选择DashScope API-KEY、ECS实例规格和可用区,以及输入实例密码

这里需要说明一点,因为创建过程中需要用到ECS服务器,那么ECS服务器默认是按量付费,如果你没有购买ECS服务器,且账户余额小于100元,就会报这个错误

错误信息

Resource CREATE failed: ResponseException: resources.EcsInstance: Your account does not have enough balance to order postpaid product. Code: InvalidAccountStatus.NotEnoughBalance RequestId: 4A2DEAEE-D4B0-30F6-AE5E-D9CA88AEC243

那么此时的解决办法就是去用户中心补足账户余额大于100元,然后再次从ROS控制台重新操作。其实在你选择完资源之后的创建页面就有账户余额不足提示的

补足余额大于100元之后点击【创建】进入部署,部署到 80% 左右,会比较慢,耐心等待

创建成功后,点击【输出】找到体验地址,

然后点击体验地址即可进入通义万相体验页面

部署结束之后,下面就开始对话题展开聊聊。

希望图像生成类应用具备哪些功能

对于图像生成类应用,那么从用户群体来看,自然是像我这样的需要文生图,并且自己不会画画的用户。文生图的一大重要场景就是可以通过输入文本内容,实现转化大脑中期待的这段文本所描述的场景。

通义万相的功能个人也用的不少,基本上是从一开始就在用,通义万相地址:https://tongyi.aliyun.com/wanxiang/creation

目前通义万相的生成效果基本是没有大方向的问题,但是在一些小细节处理上总是不太理想。比如这里我需要生成的是【可爱 姐姐 淘气 弟弟】然后生成的四幅图中我唯一比较满意的图左上角却有个图标。然后我就下载这图再次通过通义万相想要去掉这个图标,正如截图中的一样,尝试了几次都没有成功。

希望后续图像生成类应用,比如通义千问,可以有上下文的功能。当提供关键词文生图之后,那么可以基于已经生成的图片继续提出关键词进行优化,就像我需要去掉左上角图标一样。这样的话经过关键词的不断精细化和目的化,从而让图片生成的效果更符合预设的效果,从而更好的满足图像生成类应用的用户需求。

通义万相改进建议

就像上面我提到的一样,从通义万相上线到现在,自己一直是有在使用通义万相文生图的,从整体上来说,通义万相对于文本内容的把握方向是很准确的,且每次生成的图片也都是契合文本内容的。但是从使用之初到现在,并没有那次的文生图是特别满意和认可的,往往最终的选择就是四选一,从四个中挑出来一个相对满意的。

改进建议,正如上面提到的一样,希望通义万相可以有一个上下文的理解在里面,用户可以基于第一次提出的文本内容对生成的图片进行多次的精修,从而达到用户期待的效果这样。

相关推荐
春末的南方城市7 天前
浙大|腾讯|华为 提出定制化视频生成框架VideoMaker,可通过参考图实现Zero-shot定制化视频生成。
人工智能·计算机视觉·aigc·音视频·图像生成
春末的南方城市12 天前
Google发布图像生成新工具Whisk:无需复杂提示词,使用图像和人工智能将想法可视化并重新混合
人工智能·计算机视觉·aigc·图像生成
春末的南方城市17 天前
东京大学联合Adobe提出基于指令的图像编辑模型InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
人工智能·计算机视觉·adobe·aigc·音视频·图像生成
AI生成未来20 天前
NeurIPS 2024 | 像素级LLM实现图像视频理解、生成、分割和编辑大统一(昆仑万维等)
图像生成·图像编辑·视频生成
春末的南方城市21 天前
厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
人工智能·3d·aigc·音视频·图像生成
春末的南方城市21 天前
Huggingface Trending!可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!
人工智能·计算机视觉·aigc·controlnet·图像生成
AI生成未来1 个月前
图像修复和编辑大一统 | 腾讯&北大等联合提出BrushEdit:BrushNet进阶版来了
图像生成·图像编辑·图像修复
春末的南方城市1 个月前
单幅图像合成 360° 3D 场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
人工智能·3d·aigc·controlnet·图像生成
算家云1 个月前
文生图模型开源之光!ComfyUI - AuraFlow本地部署教程
人工智能·文生图·开源模型·模型构建·算家云·算力租赁·auraflow
算家云2 个月前
ComfyUI-unclip模型部署指南
人工智能·aigc·sd·图像生成·comfyui·工作流·unclip 模型