stable diffusion

sculida14 小时前
stable diffusion
秋叶sd-webui频繁出现生成后无反应的问题故障环境:秋叶整合包sd-webui-aki-v4.11.1-cu128 故障现象:webui可正常打开,但是点击"生成"后进度条一直“等待中”,稍后生成按钮又是可点击状态。 排查思路:腾讯元宝说跟插件有关 排查过程:重命名extensions文件夹,故障现象消失。重命名回。在启动器的“版本管理->扩展”里逐半勾选或去除,得知仅去除sd-webui-supermerger插件时,故障现象也消失。切换sd-webui-supermerger的250621,250329几个版本都还是故障。 临时解法:停用sd
HORSE RUNNING WILD4 天前
人工智能·学习·机器学习·stable diffusion
【物理与机器学习】从非平衡热力学到扩散模型摘要:扩散模型将非平衡热力学的“噪声注入—去噪逆转”理念注入生成建模中。DDPM(Denoising Diffusion Probabilistic Models)在 SD2015 的基础上,通过重参数化、损失简化、固定方差和网络架构优化等一系列改进,实现了更稳定的训练和更高质量的生成。本文将从物理直觉出发,面向概率论初学者详细推导每一步公式,在一些重要概念处专门附上实例,确保新手友好。
取不好名字=5 天前
笔记·学习·ai作画·stable diffusion
【ComfyUI学习笔记01】下载安装 | 运行第一个工作流 | 学习思路你好!这是博主学习ComfyUI时的心得笔记,从零开始。博主是工业设计专业的学生,学ComfyUI是为了批量和易控地渲染手绘图以及生成特定人物,主要面向应用,不会在底层原理上有过多深入。每期的推荐资料会放在文章末尾。 本系列一般不涉及节点参数的解读,推荐需要时,在Github上检索学习。 初来乍到,请多指教!
qq_3988989317 天前
stable diffusion
【简单三步】Stable diffusion Webai本地部署无法加载模型并报openai/clip-vit-large-patch14错误的解决方法
ai_xiaogui17 天前
人工智能·stable diffusion·一键发布ai项目·熊哥aistarter教程·开发者必备aistarter
AIStarter用户与创作者模式详解:一键管理Stable Diffusion项目!作为开发者,你是否为管理多个Stable Diffusion项目而头疼?AIStarter的用户与创作者模式帮你轻松搞定!熊哥打造的开源平台支持一键下载、安装和发布AI项目,高效管理AIStarter项目,适合小白和开发者。本文详细解析其功能,助你快速上手AIStarter!
一禅(OneZen)17 天前
windows·stable diffusion
「Windows/Mac OS」AIGC图片生成视频 ,webui + stable-diffusion环境部署教程Python3.10 下载地址:传送门安装 Python 3 教程检查是否安装成功 Windows+R 输入 cmd 回车
ai_xiaogui20 天前
人工智能·stable diffusion·部署ai工具·ai应用市场教程·sd快速部署·comfyui一键安装
一键部署AI工具!用AIStarter快速安装ComfyUI与Stable DiffusionAIStarter部署AI工具,让AI开发更简单!无需研究复杂环境配置,AIStarter平台提供一键安装ComfyUI和Stable Diffusion,支持多版本选择,快速上手。以下是详细步骤:
sigmoidAndRELU20 天前
笔记·stable diffusion·世界模型
读Vista世界模型能够预见不同动作所产生的后果,这对于实现自动驾驶具有至关重要的意义。然而,现有的驾驶世界模型在面向未见环境的泛化能力、关键细节的预测保真度以及灵活的动作控制等方面仍存在局限性。本文提出了一种具备泛化能力、高保真预测性能及多样化可控性的驾驶世界模型——Vista。通过对现有方法的系统性分析,我们引入了若干关键技术以克服上述问题。为实现对真实世界动态的高分辨率准确预测,我们设计了两种新的损失函数,分别用于增强运动实例和结构信息的学习效果。同时,我们还提出了一种有效的潜在空间替换策略,将历史帧作为先验信
NetX行者1 个月前
人工智能·stable diffusion
Stable Diffusion:开启AI图像生成新纪元在当今数字化时代,人工智能技术正以前所未有的速度改变着我们的生活和工作方式。其中,Stable Diffusion作为一种强大的AI图像生成工具,自2022年发布以来,便在创意设计、艺术创作等多个领域引起了广泛关注。本文将深入探讨Stable Diffusion的原理、功能特点以及其在实际应用中的表现,以期为读者揭开这一神秘工具的面纱。
修炼室1 个月前
stable diffusion
Stable Diffusion WebUI 本地部署完整教程本教程基于 Windows 系统,适合 AI 绘画爱好者或初学者,旨在帮助大家从零部署并运行本地的 Stable Diffusion 模型界面(Web UI)。我们将从克隆项目、配置环境到运行界面,并附上常见网络问题的解决方案。
这是一个懒人1 个月前
stable diffusion·comfyui·模型下载
SD和comfyui常用模型介绍和下载comfyui插件下载,解压放到custom_nodes目录下,包含 comfyui-animatediff-evolved(视频插件) 和 comfyui_controlnet_aux(controlnet插件)以及其他常用插件 custom_nodes其他插件.zip 和 各个插件依赖的模型文件。
有点小帅得平哥哥1 个月前
stable diffusion
Stable Diffusion WebUI 本地部署指南(Windows 11 + RTX 4060 Ti)手动下载cuda依赖: https://download.pytorch.org/whl/cu121/torch-2.1.2%2Bcu121-cp310-cp310-win_amd64.whl
CoovallyAIHub2 个月前
计算机视觉·stable diffusion
突破异常数据瓶颈!AnomalyAny:一句话+一张图,零样本生成任意异常图像【导读】在工业制造、食品质检、自动驾驶等场景中,异常检测(Anomaly Detection, AD)被广泛应用。但现实中的异常数据稀缺,导致训练高质量检测模型变得非常困难。>>更多资讯可加入CV技术群获取了解哦~
写代码的小阿帆2 个月前
论文阅读·stable diffusion·transformer
Fractal Generative Models论文阅读笔记与代码分析何恺明分型模型这篇文章在二月底上传到arXiv预出版网站到现在已经过了三个月,当时我也听说这篇文章时感觉是大有可为,但是几个月不知道忙啥了,可能错过很多机会,但是亡羊补牢嘛,而且截至目前,该文章应该也还是生成模型领域最重大的理论突破。
春末的南方城市2 个月前
人工智能·计算机视觉·stable diffusion·aigc·transformer
港科大&快手提出统一上下文视频编辑 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!由香港科技大学、快手科技提出的UNIC(统一上下文视频编辑)是一个简单而有效的框架,它以上下文的方式统一单个模型中的各种视频编辑任务。从此,视频编辑用着一个工具就够了!
多恩Stone2 个月前
stable diffusion
【Stable Diffusion 1.5 】在 Unet 中每个 Cross Attention 块中的张量变化过程特征图 (Latent) 尺寸和注意力图(attention map)尺寸在扩散模型中有差异,是由于模型架构和注意力机制的特性决定的。
今夕节度使2 个月前
stable diffusion
ARM架构推理Stable Diffusiond代码仓库:https://github.com/siutin/stable-diffusion-webui-docker.git
远瞻。2 个月前
人工智能·算法·stable diffusion·音视频·超分辨率重建
【论文精读】2024 ECCV--MGLD-VSR现实世界视频超分辨率(RealWorld VSR)现实世界中的低分辨率(LR)视频存在多样化和复杂的退化现象,这对视频超分辨率(VSR)算法在高质量地再现其高分辨率(HR)对应物时提出了巨大的挑战。最近,扩散模型在图像还原任务中展现出了令人信服的生成真实细节的性能。然而,扩散过程具有随机性,使得控制还原图像内容变得困难。当将扩散模型应用于视频超分辨率(VSR)任务时,这个问题变得更加严重,因为时间一致性对视频的感知质量至关重要。 在本文中,我们通过利用预训练的潜在扩散模型的优势,提出了一种有效的实际应用视频超分辨率算法。为了确保相邻帧之间内容的一致性,我
远瞻。2 个月前
论文阅读·人工智能·算法·stable diffusion·音视频·超分辨率重建
【论文精读】2024 CVPR--Upscale-A-Video现实世界视频超分辨率(RealWorld VSR)基于文本的扩散模型在生成和编辑方面表现出了显著的成功,显示出利用其生成先验增强视觉内容的巨大潜力。然而,由于对输出逼真度和时间一致性的高要求,将这些模型应用于视频超分辨率仍然具有挑战性,而这一点又因扩散模型固有的随机性而变得更加复杂。我们的研究引入了Upscale-A-Video,一种用于视频上采样的文本引导的潜在扩散方法。该框架通过两个关键机制确保时间一致性:局部上,它将时间层集成到U-Net和VAE-解码器中,保持短序列内的一致性;全局上,在不进行训练的情况下,引入了一个流引导的递归潜在传播模块,通过
乱世刀疤2 个月前
人工智能·ai作画·stable diffusion
AI绘画:手把手带你Stable Diffusion从入门到精通(系列教程)超级强大而又完全免费的AI绘画软件,当属Stable Diffusion,只要你的显卡够给力,批量产图的能力不在话下。