在autodl搭建stable-diffusion-webui+sadTalker

本文介绍在autodl.com搭建gpu服务器,实现stable-diffusion-webui+sadTalker功能,图片+音频 可生成视频。

autodl租GPU

自己本地部署SD环境会遇到各种问题,网络问题(比如huggingface是无法访问),所以最好的方式是租用GPU,可以通过以下视频了解如何使用autodl.com

AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL

炼丹平台AutoDL的简单使用_哔哩哔哩_bilibili

autoDL比较好的点就是上边有很多大佬已经部署好的环境镜像,直接使用就行。

如图是我租用的一个GPU实例。

选择的镜像是 小李xiaolxlAUTOMATIC1111/stable-diffusion-webui的v15.3版本。

镜像使用说明见大佬的视频介绍:

AI绘画云端部署-整合版4.0正式发布 | 全新重构启动3.0 | 全流程教程_哔哩哔哩_bilibili

安装SadTalker

SadTalker git 点击这里。

sadTalker插件安装

stable-diffusion-webui安装SadTalker插件的方式很多,我这里使用从url安装的方式。

别忘了开启加速

插件安装成功后,开始下载模型。

模型下载

SadTalker需要两种模型,checkpoints和gfpgan。下载方式推荐如下两种。

从git下载
阿里云魔搭下载

魔搭社区

模型下载好,需要将模型放到GPU服务器上。

autodl.com支持直接从云盘把文件拷贝到实例,详细可参考如下:

AutoDL帮助文档

我用的是阿里云盘,因为百度云盘的鉴权比骄麻烦。我这边实测如果从阿里云盘拷贝模型到autodl.com,速度能达到10MB/s以上。

模型文件放置的位置如下:

stable-diffusioni-webui/SadTalker下建立两个文件夹,checkpoints和gfpgan

这里有个要注意的点:模型文件的权限都要改成777(chmod -R 777 ./*),因为sd-webui启动时会切换到其他的user,如果模型文件没有访问权限,就会重新发起模型下载

重启webui

在extension里点击 apply and quit,就会重启webui重新加载。

测试生成视频

sadTalker的使用方式是 图片+声音 生成视频。

文字转语音工具

我使用的微信小程序,搜索:配音家,使用很方便,文字输入就能导出音频。

测试生成视频

保存当前镜像

autodl.com支持把当前的环境保存成自己的镜像,以后自己直接使用,非常方便。

相关推荐
橙子小哥的代码世界4 分钟前
【机器学习】【KMeans聚类分析实战】用户分群聚类详解——SSE、CH 指数、SC全解析,实战电信客户分群案例
人工智能·python·机器学习·kmeans·数据科学·聚类算法·肘部法
k layc8 分钟前
【论文解读】《Training Large Language Models to Reason in a Continuous Latent Space》
人工智能·python·机器学习·语言模型·自然语言处理·大模型推理
代码猪猪傻瓜coding17 分钟前
【模块】 ASFF 模块
人工智能·深度学习
阿正的梦工坊23 分钟前
Sliding Window Attention(滑动窗口注意力)解析: Pytorch实现并结合全局注意力(Global Attention )
人工智能·pytorch·python
rgb2gray1 小时前
GeoHD - 一种用于智慧城市热点探测的Python工具箱
人工智能·python·智慧城市
火车叼位1 小时前
5个Why、SWOT, 5W2H等方法论总结,让你的提示词更加精炼
人工智能
阿正的梦工坊1 小时前
PyTorch下三角矩阵生成函数torch.tril的深度解析
人工智能·pytorch·矩阵
说私域2 小时前
电商运营中私域流量的转化与变现:以开源AI智能名片2+1链动模式S2B2C商城小程序为例
人工智能·小程序·开源·流量运营
老A的AI实验室2 小时前
通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law
人工智能·深度学习·算法·chatgpt·llm·agi·rl
多云的夏天2 小时前
AI(14)-prompt
人工智能