在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片(上)

背景介绍

在2024年的亚马逊云科技re:Invent大会上提前预告的Stable Diffusion 3.5 Large,现在已经在Amazon Bedrock上线了!各位开发者们现在可以使用该模型,根据文本提示词文生图生成高质量的图片,并且支持多种图片风格生成,助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。

2024年10月,图像生成模型厂商Stability AI发布了Stable Diffusion 3.5 Large,这是Stable Diffusion系列中目前最强大的模型,拥有81亿个参数,值得一提的是该模型也是在Amazon SageMaker HyperPod上进行训练的,该模型可以生成极高的图像质量并具有出色的提示词匹配能力。Stable Diffusion 3.5 Large可增效开发者们在故事插画制作、概念艺术创作以及视觉特效应用的快速原型开发。大家可以快速生成高质量的高达1兆像素图片,适用于媒体营销活动、社交媒体文章插图和广告,既可以节省时间和资源,又能以上场景中的增强图像创意效果。

在本系列的上篇中,我们将介绍在亚马逊云科技控制台中,通过Stable Diffusion 3.5 Large模型生成图片的具体步骤操作,手把手带大家生成一个赛博朋克风的图片。

Stable Diffusion 3.5 Large模型的优势:

  1. 多样化风格 -- 该模型可以生成多种图像类别和艺术视觉效果,涵盖3D渲染、摄影、绘画、线条艺术以及几乎任何大家能想到的视觉风格。

  2. 精准的提示词匹配 -- Stable Diffusion 3.5 Large具备行业最先进SOTA的提示词匹配能力,能够精准按照文本提示生成图像,使其成为大家高效、高质量图片艺术创作的理想选择。

  3. 多元化输出 -- 无需复杂和冗长的提示词,大家即可还原我们的出花花世界,通过模型多样化的生成能力,可以轻松生成不同肤色与特征的人物形象。

除此之外,目前Amazon Bedrock上的Stable Image Ultra模型也进行了同步升级,Stable Image Ultra采用Stable Diffusion 3.5 Large作为其底层架构。Stable Image Ultra依托Stability AI最先进的模型算法(包括这次上新的Stable Diffusion 3.5),在图像生成行业里创建了全新标准,可以高效实现字体排版、复杂构图、动态光影、鲜艳色彩和艺术创作的一致性和连贯性。

借助Amazon Bedrock最新上线的Stable Diffusio 模型,大家可以获得更为丰富的图像解决方案,以提升图片创意度并赋能大家的图像生成应用。

具体步骤

  1. 如果大家是首次使用Stability AI模型,大家需要登入亚马逊云科技账户进入Amazon Bedrock控制台,在左侧菜单底部选择 "Model access"(模型访问),然后在Stability AI类别中开启Stable Diffusion 3.5 Large的访问权限。
  1. 在 Amazon Bedrock中开始使用Stability AI模型之前,我们要进入左侧菜单的Playgrounds模型交互界面中,选择"Image"图片生成场景。然后点击"Select model"选择模型,在分类一列中选择 Stability AI,并选择Stable Diffusion 3.5 Large模型,推理模式为"on-demand"模式。
  1. 接下来大家就可以在左侧配置模型参数,在下方输入提示词来生成我们想要风格的图篇,以下是一个实例提示词:

High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.

"夜晚霓虹灯照亮的东京小巷,街头充满活力,蒸汽从小吃摊升起,五光十色的霓虹灯映照在湿漉漉的路面上。"

在输入提示词后,我们点击Run就可以生成图片了,下图是我们生成的一张赛博朋克风的图片样例。

以上就是亚马逊云科技上使用Stable Diffusion 3.5 Large模型生成图片的全部内容,在本篇中我们介绍了如何在亚马逊云科技的AI模型托管服务Amazon Bedrock上,通过控制台操作配置图像生成参数,生成一张赛博朋克风图片的方案。欢迎大家关注小李哥和本系列的下篇,不要错过未来更多国际前沿的AWS云开发/云架构方案。

相关推荐
wzx_Eleven17 小时前
【论文阅读】Towards Privacy-Enhanced and Robust Clustered Federated Learning
论文阅读·人工智能·算法·机器学习·支持向量机·网络安全
CV-杨帆17 小时前
大模型在题目生成中的安全风险研究综述
人工智能·深度学习·安全
DisonTangor17 小时前
【阿里拥抱开源】Qwen团队开源新一代深度思考模型——Qwen3-Next-80B-A3B-Thinking
人工智能·学习·语言模型·开源·aigc
过河卒_zh156676618 小时前
9.12AI简报丨腾讯投资AI游戏平台,B站开源AniSora V3
人工智能·算法·游戏·aigc·算法备案·生成合成类算法备案
补三补四18 小时前
神经网络基本概念
人工智能·深度学习·神经网络
IT_陈寒18 小时前
Spring Boot 3.2 新特性全解析:这5个性能优化点让你的应用提速50%!
前端·人工智能·后端
VR最前沿19 小时前
Xsens运动捕捉技术彻底改变了数字化运动方式,摆脱实验室局限,将生物力学引入现实
人工智能·科技
网易伏羲19 小时前
网易伏羲亮相Arm Unlocked 2025,携手Arm探索中国人工智能创新之路
人工智能·游戏ai·网易伏羲
寒月霜华19 小时前
机器学习ML-简介、数据获取、网页数据抓取
人工智能·机器学习
程序猿阿伟19 小时前
《AI游戏开发中的隐性困境:从战斗策略失效到音效错位的深度破局》
人工智能