stable diffusion

老刘说AI14 天前
人工智能·stable diffusion·架构·embedding
类Sora模型:解锁动态视觉艺术的密码AI生成文字、图片、视频的核心前提,本质是模型对内容的“理解”——生成文字需先读懂文字语义,生成图片需先看懂图像特征,文生图则需同时吃透提示词与图像逻辑,视频生成同样离不开对视频内容的深度解析。
python-码博士14 天前
stable diffusion
Stable Diffusion 3 / FLUX 类模型中的 Flow Matching:怎么用、怎么调、怎么避坑关键词:SD3、FLUX、FlowMatchEuler、Diffusers、DiT、MMDiT、LoRA 目标:从使用者角度理解 Flow Matching 在现代图像生成管线里的位置
Rocky Ding*16 天前
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师/开发工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
Asimov_Liu18 天前
stable diffusion·自动驾驶·具身智能·vla·flow matching
Diffusion 与 Flow Matching 数学原理及其在 VLA Action 生成中的应用作者:Asimov+Codex | 日期:2026-06-11 适合:Diffusion / Flow Matching 初学者,关注 VLA(Vision-Language-Action)方向
Rocky Ding*18 天前
论文阅读·人工智能·深度学习·机器学习·stable diffusion·aigc·ai-native
Token Merging for Fast Stable Diffusion:一篇读懂 Stable Diffusion 的免训练加速机制欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师/开发工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
yuguo.im19 天前
macos·stable diffusion
Mac M4 安装 sd-webui 踩坑全记录本地跑 Stable Diffusion 的想法很简单,执行起来就不是那么回事了。从 AUTOMATIC1111 的 sd-webui 克隆下来,bash webui.sh 一敲,错误接连出现。以下是完整的踩坑过程和对应解法。
hugo_im20 天前
stable diffusion
Mac M4 安装 sd-webui 踩坑全记录想在 Apple Silicon Mac 上本地跑 Stable Diffusion,安装过程远比想象中麻烦:CLIP wheel 构建失败、Stability AI 仓库已删、HuggingFace 连不上,每一关都能劝退新手。本文把每个坑的原因和解法整理清楚,照着做可以少走几个小时弯路。
一叶知秋dong20 天前
人工智能·深度学习·stable diffusion
Stable diffusion 工作原理可以把 Stable Diffusion 想象成一个住在“压缩世界”里的“雕塑家”。它接收一段文字指令,然后在一块充满随机杂质的“信息原石”上,一步步精心雕琢,最终呈现出符合描述的精美作品。它的核心思想是将计算核心放在一个更高效的“压缩世界”里,这使得AI绘画的普及成为了可能。
仰望尾迹云23 天前
stable diffusion·ai绘画·图像生成
灵感画廊入门:AI绘画零基础到精通“见微知著,凝光成影。将梦境的碎片,凝结为永恒的视觉诗篇。”你是否曾有过这样的瞬间?脑海中闪过一个绝妙的画面,却苦于无法用画笔将其呈现。或者,你渴望创作,却被复杂的软件和技法门槛拒之门外。今天,这一切都将改变。
AI极客菌23 天前
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?专业玩家与普通玩家,用的「AI绘画工具」有什么不同?今天有个朋友找我聊天,发现他的头像是个线稿,感觉用来练手AI生成建筑效果图挺好的。
大叔and小萝莉23 天前
stable diffusion·ai绘画·gpu部署
比迪丽AI绘画镜像免配置:GPU算力优化部署,显存占用降低40%你是不是也遇到过这种情况:想玩AI绘画,结果被复杂的安装配置劝退?好不容易装好了,又发现显存不够用,生成一张图要等半天,还动不动就爆显存?
日光明媚24 天前
人工智能·深度学习·机器学习·stable diffusion·aigc
从代码的角度解读DMD2dmd2思想解读移步从 DMD 到 DMD2:搞懂扩散模型的 “提速革命“-CSDN博客官方项目地址:tianweiy/DMD2: (NeurIPS 2024 Oral 🔥) Improved Distribution Matching Distillation for Fast Image Synthesis
ai_xiaogui24 天前
服务器·人工智能·stable diffusion
PanelAI 是什么?服务器上 ComfyUI、OpenClaw、Stable Diffusion 一键部署神器,普通开发者也能轻松管理 AI 项目PanelAI 到底是干什么的?一文看懂服务器 AI 项目傻瓜式部署方案很多朋友看到熊哥之前关于 PanelAI 的视频后还在困惑:这个工具究竟能解决什么痛点?本篇基于最新视频内容,为大家详细梳理 PanelAI 的核心功能和实际使用场景。
ZHW_AI课题组25 天前
人工智能·python·算法·机器学习·stable diffusion
使用Stable Diffusion v1.5文本引导与无分类器引导(CFG)算法实现条件生成图片1.作者介绍董柯帆,男,西安工程大学电子信息学院,2025级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能
三无推导1 个月前
人工智能·pytorch·windows·stable diffusion·aigc·ai绘画·持续部署
ComfyUI 安装部署教程:Windows 下快速搭建可视化 AI 绘图工作流,零基础也能跑通这两年 AI 绘图工具是真的多,但如果你稍微玩深一点,很快就会发现: 只会“输入提示词然后点生成”,其实不够。
code_pgf1 个月前
人工智能·stable diffusion
ViT 与 MAE 在图像特征提取方面的优势详解ViT(Vision Transformer)是一种视觉骨干网络架构:它将图像切分为 Patch 序列,再通过 Transformer Encoder 建模局部区域与全局区域之间的关系。
code_pgf1 个月前
人工智能·stable diffusion
多模态技术在主要 AI 应用领域中的应用分析与工程落地建议文档类型:技术调研 / 应用领域分析 更新时间:2026-05-29 适用方向:多模态大模型(MLLM)、视觉语言模型(VLM)、视觉语言动作模型(VLA)、多传感器融合、行业智能化系统
程序员大辉1 个月前
stable diffusion·文生图·sd·z-image
Z-Image迷你整合包:只有10G大小,5G小显存也能跑的Stable Diffusion文生图工具Z-Image整合包是把Stable Diffusion WebUI(简称SD WebUI)打包好的一键启动包。Stable Diffusion本身是一个AI文生图模型,打一行字描述你想要的画面,它就能生成一张图。但原版SD的安装过程很折腾,要装Python、装Git、下模型、配环境变量,新手搞一天都不一定能跑起来。
嗝o゚1 个月前
人工智能·stable diffusion·cann
昇腾CANN cann-recipes-infer 仓:Stable Diffusion 推理加速方案你想在昇腾 NPU 上跑 Stable Diffusion 生成图片,UNet 推理一次要 30 秒,别人的 RTX 4090 只要 8 秒。
菜鸟是大神1 个月前
数据库·chatgpt·ai作画·stable diffusion·文心一言·dall·e 2
04-高效编写CLAUDE.md每次提编写要求都要和Claude Code 说明项目的技术栈,编程规范,这是件繁琐并让人抓狂的体验。所以这节课要学习CLAUDE.md ,它就像是给Claude的"项目入职手册",Claude 每次开始对话时,都会自动阅读这份手册,了解你的项目背景,明确它在干活时应该遵循的底层规则。