技术栈
stable diffusion
CoovallyAIHub
3 天前
计算机视觉
·
stable diffusion
突破异常数据瓶颈!AnomalyAny:一句话+一张图,零样本生成任意异常图像
【导读】在工业制造、食品质检、自动驾驶等场景中,异常检测(Anomaly Detection, AD)被广泛应用。但现实中的异常数据稀缺,导致训练高质量检测模型变得非常困难。>>更多资讯可加入CV技术群获取了解哦~
写代码的小阿帆
4 天前
论文阅读
·
stable diffusion
·
transformer
Fractal Generative Models论文阅读笔记与代码分析
何恺明分型模型这篇文章在二月底上传到arXiv预出版网站到现在已经过了三个月,当时我也听说这篇文章时感觉是大有可为,但是几个月不知道忙啥了,可能错过很多机会,但是亡羊补牢嘛,而且截至目前,该文章应该也还是生成模型领域最重大的理论突破。
春末的南方城市
5 天前
人工智能
·
计算机视觉
·
stable diffusion
·
aigc
·
transformer
港科大&快手提出统一上下文视频编辑 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!
由香港科技大学、快手科技提出的UNIC(统一上下文视频编辑)是一个简单而有效的框架,它以上下文的方式统一单个模型中的各种视频编辑任务。从此,视频编辑用着一个工具就够了!
多恩Stone
9 天前
stable diffusion
【Stable Diffusion 1.5 】在 Unet 中每个 Cross Attention 块中的张量变化过程
特征图 (Latent) 尺寸和注意力图(attention map)尺寸在扩散模型中有差异,是由于模型架构和注意力机制的特性决定的。
今夕节度使
9 天前
stable diffusion
ARM架构推理Stable Diffusiond
代码仓库:https://github.com/siutin/stable-diffusion-webui-docker.git
远瞻。
13 天前
人工智能
·
算法
·
stable diffusion
·
音视频
·
超分辨率重建
【论文精读】2024 ECCV--MGLD-VSR现实世界视频超分辨率(RealWorld VSR)
现实世界中的低分辨率(LR)视频存在多样化和复杂的退化现象,这对视频超分辨率(VSR)算法在高质量地再现其高分辨率(HR)对应物时提出了巨大的挑战。最近,扩散模型在图像还原任务中展现出了令人信服的生成真实细节的性能。然而,扩散过程具有随机性,使得控制还原图像内容变得困难。当将扩散模型应用于视频超分辨率(VSR)任务时,这个问题变得更加严重,因为时间一致性对视频的感知质量至关重要。 在本文中,我们通过利用预训练的潜在扩散模型的优势,提出了一种有效的实际应用视频超分辨率算法。为了确保相邻帧之间内容的一致性,我
远瞻。
14 天前
论文阅读
·
人工智能
·
算法
·
stable diffusion
·
音视频
·
超分辨率重建
【论文精读】2024 CVPR--Upscale-A-Video现实世界视频超分辨率(RealWorld VSR)
基于文本的扩散模型在生成和编辑方面表现出了显著的成功,显示出利用其生成先验增强视觉内容的巨大潜力。然而,由于对输出逼真度和时间一致性的高要求,将这些模型应用于视频超分辨率仍然具有挑战性,而这一点又因扩散模型固有的随机性而变得更加复杂。我们的研究引入了Upscale-A-Video,一种用于视频上采样的文本引导的潜在扩散方法。该框架通过两个关键机制确保时间一致性:局部上,它将时间层集成到U-Net和VAE-解码器中,保持短序列内的一致性;全局上,在不进行训练的情况下,引入了一个流引导的递归潜在传播模块,通过
乱世刀疤
14 天前
人工智能
·
ai作画
·
stable diffusion
AI绘画:手把手带你Stable Diffusion从入门到精通(系列教程)
超级强大而又完全免费的AI绘画软件,当属Stable Diffusion,只要你的显卡够给力,批量产图的能力不在话下。
layneyao
16 天前
ai作画
·
stable diffusion
从0到1搭建AI绘画模型:Stable Diffusion微调全流程避坑指南
系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu随着生成式AI技术的爆发,Stable Diffusion已成为全球最主流的开源AI绘画框架。然而,从基础模型到定制化部署的过程中,开发者常面临数据集构建、模型训练、推理优化等环节的诸多挑战。本文以Stable Diffusion v2.1为基础,系统梳理微调全流程的核心步骤,涵盖数据准备、模型架构选择、超参数调优、模型压缩与部署等关键环节,并结合真实案例揭示常见误区。通过提供可复现的代码示例与硬件配置建议,为AI绘
远瞻。
16 天前
论文阅读
·
stable diffusion
·
音视频
·
超分辨率重建
【论文精读】2024 arXiv --VEnhancer现实世界视频超分辨率(RealWorld VSR)
我们提出了VEnhancer,这是一种生成时空增强框架,通过在空间领域中添加更多细节以及在时间领域中合成详细的运动,从而改善现有的文本到视频的结果。针对生成的低质量视频,我们的方法可以通过统一的视频扩散模型同时提高其空间和时间分辨率,支持任意的上采样空间和时间尺度。此外,VEnhancer有效地去除了生成视频中的空间伪影和时间闪烁现象。为此,我们基于预训练的视频扩散模型,训练一个视频控制网络,并将其作为低帧率和低分辨率视频的条件注入到扩散模型中。为了有效训练这个视频 ControlNet,我们设计了时空数
立秋6789
18 天前
stable diffusion
深入理解Diffusers: 从基础到Stable Diffusion
Diffusers是一个功能强大且灵活的扩散模型工具箱,它让构建和部署扩散系统变得简单直观。本文将带你深入了解Diffusers的核心组件,并通过实例展示如何从零构建扩散系统。
Liudef06
18 天前
stable diffusion
Stable Diffusion底模对应的VAE推荐
以下是主流Stable Diffusion底模对应的VAE推荐表格:注:SD1.5/SDXL的VAE可交叉兼容部分场景,但FLUX需严格匹配对应版本
胖墩会武术
18 天前
前端
·
vscode
·
stable diffusion
通过Auto平台与VScode搭建远程开发环境(以Stable Diffusion Web UI为例)
White-box-Cartoonization stable-diffusion-webui 轻松复现一张AI图片(系列教程-推荐) 逼真的图片生产 | Stable Diffusion WebUI本地部署看这一篇就够了
白熊188
23 天前
人工智能
·
计算机视觉
·
stable diffusion
·
大模型
【图像大模型】Stable Diffusion 3 Medium:多模态扩散模型的技术突破与实践指南
Stable Diffusion 3 Medium(SD3-M)采用混合专家(MoE)与扩散Transformer(DiT)结合的创新架构,其参数规模达到20亿级别但保持高效推理能力。核心公式表达如下:
3D霸霸
24 天前
笔记
·
学习
·
stable diffusion
Stable Diffusion 学习笔记02
模型下载网站:1,LiblibAI-哩布哩布AI - 中国领先的AI创作平台2,Civitai: The Home of Open-Source Generative AI
乌旭
25 天前
人工智能
·
深度学习
·
stable diffusion
·
架构
·
aigc
·
midjourney
·
risc-v
开源GPU架构RISC-V VCIX的深度学习潜力测试:从RTL仿真到MNIST实战
(引述TPUv4采用RISC-V的行业案例,结合Google AI芯片战略,说明能效比已成架构迭代核心指标。此处可嵌入Tom’s Hardware报道的谷歌技术路线)
wei_shuo
1 个月前
人工智能
·
stable diffusion
·
gpu算力
·
gpuseek
GpuGeek 实操指南:So-VITS-SVC 语音合成与 Stable Diffusion 文生图双模型搭建,融合即梦 AI 的深度实践
本文将详细讲解 So-VITS-SVC 语音合成与 Stable Diffusion 文生图的搭建方法,以及二者与即梦 AI 融合的实践技巧,无论你是想让文字 “开口唱歌”,还是将灵感变为精美图像,都能在这里找到从入门到实操的全流程攻略,助你快速掌握 AI 创作核心技能。
这是一个懒人
1 个月前
stable diffusion
Stable Diffusion WebUI 插件大全:功能详解与下载地址
Stable Diffusion WebUI 的强大之处在于其丰富的插件生态,这些插件可以大幅提升 AI 绘画的效率和质量。本文将详细介绍 21 个常用插件,包括它们的功能、效果说明以及下载地址,帮助你更好地使用 Stable Diffusion WebUI。
浪淘沙jkp
1 个月前
人工智能
·
stable diffusion
·
agent
·
dify
·
ollama
·
deepseek
AI大模型学习十八、利用Dify+deepseekR1 +本地部署Stable Diffusion搭建 AI 图片生成应用
最近在学习Dify工作流的一些玩法,下面将介绍一下Dify + Stable Diffusion实现文生图工作流的应用方法
Icoolkj
1 个月前
人工智能
·
stable diffusion
深入了解 Stable Diffusion:AI 图像生成的奥秘
AI 艺术与图像生成技术的兴起改变了我们创造和体验视觉内容的方式。在过去几年里,深度学习模型已经能够创造出令人惊叹的艺术作品,这些作品不仅模仿了人类艺术家的风格,甚至还能创造出前所未有的新风格。在这个领域,Stable Diffusion 模型因其高效性和高质量的图像生成能力而脱颖而出,成为 AI 生成内容(AIGC)领域的一个重要里程碑。