当大语言模型遇到AI绘画-google gemma与stable diffusion webui融合方法-矿卡40hx的AI一体机

你有想过建一台主机,又能AI聊天又能AI绘画,还可以直接把聊天内容直接画出来的机器吗?

当Google最新的大语言模型Gemma碰到stable diffusion webui会怎么样?

首先我们安装stable diffusion webui(automatic1111开源项目)我安装的是forge分支,可以参考我的另一篇文章。安装完成后,简单测试并调优,在启动参数后加一个 --api 这样可以支持外部api调用,同时加 --listen 用于远程访问(因为open-webui是docker方式的,不能直接访问宿主)

然后安装ollama及open-webui, 安装方法参考我的另外一篇文章,安装完成后,在open-webui界面中,settings设置中,找到images,把stable diffusion webui的主机地址及端口号填上去

stable diffusion的模型考虑用SD1.5或者SD2.1的,不要用SDXL的,size填512x512, steps填20 保存退出。

使用方法:

先聊天,英文不会的同学,第一句就写 "中文",然后AI语言就都是中文了。然后你就说一个大致想画的东西,让AI写一段小作文。小作文有时是英文的,有时是中文的,你可以跟AI说 "上文翻译成中文" ,然后点修改文字,修修补补,写完后,保存,再跟AI说"上文翻译成英文" 再点击 绘画,等一下,图就出来了。如果不满意,可以多次点击绘画。就这么简单了。

针对 40HX的提示:40hx显存只有8G, 所以如果要AI语言与AI同时运行,需要对显存与运行负载有规划,SDXL模型与Gemma7b都是直接能把8G显存点满的,所以一个都不能用,SD2.1+Gemma2b 这样的分配,大致是5G+2G的显存组合,刚好能用。其它优化内容见我的另外二个贴子。

相关推荐
pk_xz12345624 分钟前
Shell 脚本中变量和字符串的入门介绍
linux·运维·服务器
小珑也要变强26 分钟前
Linux之sed命令详解
linux·运维·服务器
深度学习实战训练营31 分钟前
基于CNN-RNN的影像报告生成
人工智能·深度学习
昨日之日20062 小时前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
Lary_Rock2 小时前
RK3576 LINUX RKNN SDK 测试
linux·运维·服务器
浮生如梦_2 小时前
Halcon基于laws纹理特征的SVM分类
图像处理·人工智能·算法·支持向量机·计算机视觉·分类·视觉检测
深度学习lover3 小时前
<项目代码>YOLOv8 苹果腐烂识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·苹果腐烂识别
热爱跑步的恒川3 小时前
【论文复现】基于图卷积网络的轻量化推荐模型
网络·人工智能·开源·aigc·ai编程
云飞云共享云桌面4 小时前
8位机械工程师如何共享一台图形工作站算力?
linux·服务器·网络
Peter_chq5 小时前
【操作系统】基于环形队列的生产消费模型
linux·c语言·开发语言·c++·后端