当大语言模型遇到AI绘画-google gemma与stable diffusion webui融合方法-矿卡40hx的AI一体机

你有想过建一台主机,又能AI聊天又能AI绘画,还可以直接把聊天内容直接画出来的机器吗?

当Google最新的大语言模型Gemma碰到stable diffusion webui会怎么样?

首先我们安装stable diffusion webui(automatic1111开源项目)我安装的是forge分支,可以参考我的另一篇文章。安装完成后,简单测试并调优,在启动参数后加一个 --api 这样可以支持外部api调用,同时加 --listen 用于远程访问(因为open-webui是docker方式的,不能直接访问宿主)

然后安装ollama及open-webui, 安装方法参考我的另外一篇文章,安装完成后,在open-webui界面中,settings设置中,找到images,把stable diffusion webui的主机地址及端口号填上去

stable diffusion的模型考虑用SD1.5或者SD2.1的,不要用SDXL的,size填512x512, steps填20 保存退出。

使用方法:

先聊天,英文不会的同学,第一句就写 "中文",然后AI语言就都是中文了。然后你就说一个大致想画的东西,让AI写一段小作文。小作文有时是英文的,有时是中文的,你可以跟AI说 "上文翻译成中文" ,然后点修改文字,修修补补,写完后,保存,再跟AI说"上文翻译成英文" 再点击 绘画,等一下,图就出来了。如果不满意,可以多次点击绘画。就这么简单了。

针对 40HX的提示:40hx显存只有8G, 所以如果要AI语言与AI同时运行,需要对显存与运行负载有规划,SDXL模型与Gemma7b都是直接能把8G显存点满的,所以一个都不能用,SD2.1+Gemma2b 这样的分配,大致是5G+2G的显存组合,刚好能用。其它优化内容见我的另外二个贴子。

相关推荐
风象南4 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶5 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶5 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考8 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab8 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab8 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
canonical_entropy9 小时前
AI Agent 的演进之路:从对话到自主代理操作系统
低代码·aigc·agent
格砸10 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云10 小时前
可观测性 4.0:教系统如何思考
人工智能
EdisonZhou10 小时前
MAF快速入门(18)Agent Skill 快速开始
llm·aigc·agent