当大语言模型遇到AI绘画-google gemma与stable diffusion webui融合方法-矿卡40hx的AI一体机

你有想过建一台主机,又能AI聊天又能AI绘画,还可以直接把聊天内容直接画出来的机器吗?

当Google最新的大语言模型Gemma碰到stable diffusion webui会怎么样?

首先我们安装stable diffusion webui(automatic1111开源项目)我安装的是forge分支,可以参考我的另一篇文章。安装完成后,简单测试并调优,在启动参数后加一个 --api 这样可以支持外部api调用,同时加 --listen 用于远程访问(因为open-webui是docker方式的,不能直接访问宿主)

然后安装ollama及open-webui, 安装方法参考我的另外一篇文章,安装完成后,在open-webui界面中,settings设置中,找到images,把stable diffusion webui的主机地址及端口号填上去

stable diffusion的模型考虑用SD1.5或者SD2.1的,不要用SDXL的,size填512x512, steps填20 保存退出。

使用方法:

先聊天,英文不会的同学,第一句就写 "中文",然后AI语言就都是中文了。然后你就说一个大致想画的东西,让AI写一段小作文。小作文有时是英文的,有时是中文的,你可以跟AI说 "上文翻译成中文" ,然后点修改文字,修修补补,写完后,保存,再跟AI说"上文翻译成英文" 再点击 绘画,等一下,图就出来了。如果不满意,可以多次点击绘画。就这么简单了。

针对 40HX的提示:40hx显存只有8G, 所以如果要AI语言与AI同时运行,需要对显存与运行负载有规划,SDXL模型与Gemma7b都是直接能把8G显存点满的,所以一个都不能用,SD2.1+Gemma2b 这样的分配,大致是5G+2G的显存组合,刚好能用。其它优化内容见我的另外二个贴子。

相关推荐
小成202303202654 小时前
Linux高级02
linux·开发语言
HIT_Weston4 小时前
45、【Agent】【OpenCode】本地代理分析(请求&接收回调)
人工智能·agent·opencode
mounter6254 小时前
【硬核前沿】CXL 深度解析:重塑数据中心架构的“高速公路”,Linux 内核如何应对挑战?-- CXL 协议详解与 LSF/MM 最新动态
linux·服务器·网络·架构·kernel
++==4 小时前
Linux 进程间通信与线程同步技术详解:IPC 机制、线程 API、同步工具与经典同步问题
linux
逻辑君4 小时前
认知神经科学研究报告【20260010】
人工智能·深度学习·神经网络·机器学习
特长腿特长5 小时前
centos、ubantu系列机的用户和用户组的结构是什么?具体怎么配置?用户组权限怎么使用?这篇文章持续更新,帮助你复习linux的基础知识
linux·运维·centos
星河耀银海5 小时前
远控体验分享:安全与实用性参考
人工智能·安全·微服务
zzzyyy5385 小时前
Linux环境变量
linux·运维·服务器
企业架构师老王5 小时前
2026企业架构演进:科普Agent(龙虾)如何从“极客玩具”走向实在Agent规模化落地?
人工智能·ai·架构
墨风如雪5 小时前
越用越强不是广告语:拆解 Hermes Agent 的三层学习机制
aigc