技术栈
stable diffusion
空白诗
4 小时前
深度学习
·
计算机视觉
·
stable diffusion
CANN ops-nn 算子解读:Stable Diffusion 图像生成中的 Conv2D 卷积实现
本文基于 CANN ops-nn 仓库中的 Conv2D 算子实现,解析其在 AIGC 图像生成场景(如 Stable Diffusion)中的核心作用与优化策略。
学易
7 小时前
人工智能
·
ai作画
·
stable diffusion
·
报错
·
comfyui
·
缺失节点
第十五节.别人的工作流,如何使用和调试(上)?(2类必现报错/缺失节点/缺失模型/思路/实操/通用调试步骤)
前面的课程,我们已经把工作流的底层逻辑、搭建方法和基础操作都讲透了。今天,咱们要跳出 “新手村”,直接进入实战模式。我们就拿一套能从文字生成静帧,再变成完整视频的 AI 短片全流程工作流为例,一步步教你把网上下载的陌生工作流,调试到能完美运行的状态。
心疼你的一切
12 小时前
数据仓库
·
深度学习
·
stable diffusion
·
aigc
·
流程图
·
cann
基于CANN仓库算力手把手实现Stable Diffusion图像生成(附完整代码+流程图)
随着AIGC技术的爆发式发展,大模型训练与推理对算力的需求日益激增,而异构计算架构成为破解算力瓶颈的核心关键。华为CANN(Compute Architecture for Neural Networks)作为昇腾AI基础软硬件平台的核心软件栈,其开源仓库涵盖了算子库、加速引擎、框架适配等全套能力,是AIGC开发者解锁昇腾算力、降低部署门槛的“宝藏工具包”。
Niuguangshuo
2 天前
人工智能
·
深度学习
·
计算机视觉
·
stable diffusion
·
重构
·
transformer
DALL-E 3:如何通过重构“文本描述“革新图像生成
对于每一个尝试过AI绘画的人,这样的场景或许都不陌生:你满心期待地输入“一只戴着红色围巾的黑猫,坐在飘雪的窗台上,背景有暖光台灯”,得到的却可能是一只没有围巾的猫,或是一个没有台灯的窗台,甚至是一只飘在空中的猫。这种模型“听不懂人话”或“视而不见”的现象,其专业名称是 “提示跟随能力(Prompt Following)”不足。
Niuguangshuo
2 天前
stable diffusion
深入解析 Stable Diffusion XL(SDXL):改进潜在扩散模型,高分辨率合成突破
前文我们详细拆解了潜在扩散模型(LDMs)的核心架构,包括感知图像压缩、潜在扩散生成和通用条件机制,这三大模块构成了 Stable Diffusion 系列模型的技术基础。
Niuguangshuo
2 天前
人工智能
·
计算机视觉
·
stable diffusion
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
在潜在扩散模型(Latent Diffusion Models, LDMs)出现之前,高分辨率图像生成领域长期存在一个“不可能三角”:生成质量、计算效率、可控性难以兼得。
迈火
2 天前
人工智能
·
gpt
·
计算机视觉
·
stable diffusion
·
aigc
·
语音识别
·
midjourney
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
Latent Interposer InputStyle BlenderLatent EditorLatent to Image
迈火
9 天前
人工智能
·
gpt
·
计算机视觉
·
stable diffusion
·
aigc
·
语音识别
·
midjourney
Facerestore CF (Code Former):ComfyUI人脸修复的卓越解决方案
Facerestore CF InputFacerestore CF ProcessorFacerestore CF Output
重启编程之路
10 天前
stable diffusion
Stable Diffusion 参数记录
best quality, masterpiece, (photorealistic:1.3), 8k, highres, (shirley_yang:1.2), 1girl, solo, (full body shot:1.4), (whole body visible:1.3),
孤狼warrior
13 天前
人工智能
·
python
·
深度学习
·
stable diffusion
·
cnn
·
transformer
·
stablediffusion
图像生成 Stable Diffusion模型架构介绍及使用代码 附数据集批量获取
Diffusion,也就是扩散的意思。Diffusion模型是一种受到非平衡热力学启发,定义马尔科夫链的扩散步骤,向数据添加噪声,学习逆扩散过程,从噪声中构建样本。最初设计用于去噪,训练时间越长,降噪越逼真。
世界尽头与你
16 天前
安全
·
网络安全
·
stable diffusion
·
渗透测试
Stable Diffusion web UI 未授权访问漏洞
Stable Diffusion是一款功能异常强大的AI图片生成器。它不仅支持生成图片,使用各种各样的模型来达到你想要的效果,还能训练你自己的专属模型,WebUI使得Stable Diffusion有了一个更直观的用户界面,更适合新手用户,该项目github高达143K的star数
love530love
16 天前
人工智能
·
windows
·
stable diffusion
·
model keyword
【避坑指南】提示词“闹鬼”?Stable Diffusion 自动注入神秘词汇 xiao yi xian 排查全记录
模型关键词 插件https://github.com/mix1009/model-keyword在进行 AI 绘图时,你是否遇到过这种“诡异”的情况:明明提示词框已经完全清空,或者只输入了一个简单的 a cat,但在点击生成后,后台日志和图片参数里却莫名其妙多出了一个词——“xiao yi xian”?
love530love
16 天前
人工智能
·
windows
·
stable diffusion
·
大模型
·
json
·
stablediffusion
·
gradio 主题
【故障解析】Stable Diffusion WebUI 更换主题后启动报 JSONDecodeError?可能是“主题加载”惹的祸
【SD WebUI踩坑】启动报错 Expecting value: line 1 column 1 (char 0) 的终极解决方案
ai_xiaogui
20 天前
人工智能
·
stable diffusion
·
环境零配置
·
高性能内核优化
·
全功能插件集成
·
极速部署体验
Stable Diffusion Web UI 绘世版 v4.6.1 整合包:一键极速部署,深度解决 AI 绘画环境配置与 CUDA 依赖难题
对于从事 AI 创作或 AIGC 研究的开发者来说,Stable Diffusion (SD) 是目前本地化部署的首选框架。然而,原生环境搭建往往涉及复杂的 Python 虚拟环境管理、CUDA 版本的严格匹配以及大量的 Git 依赖拉取,任何一个环节出错都可能导致部署失败。
微学AI
21 天前
人工智能
·
stable diffusion
金仓数据库的新格局:以多模融合开创文档数据库
随着数字化转型进入深水区,企业对数据处理的需求早已不满足于简单的存储与调用。文档数据库凭借对非结构化数据的天生适配性,成为现代应用开发的重要支撑。不过,当企业面临技术自主可控、供应链安全以及多模数据融合处理的新要求时,传统开源文档数据库在性能、可靠性和企业级服务能力上的短板逐渐凸显。电科金仓推出的MongoDB兼容版,基于成熟的企业级内核,整合文档模型能力,为企业提供国产化升级选择。
我的golang之路果然有问题
21 天前
人工智能
·
ai作画
·
stable diffusion
·
人工智能作画
开源绘画大模型简单了解
根据 c 站的分类来看SD 系列:SD 1.5,SD 1.5 LCM等 SD 开头的,相对来说最久远不过插件丰富
我的golang之路果然有问题
21 天前
人工智能
·
stable diffusion
·
ai绘画
·
人工智能作画
·
comfy
comfyUI中的动作提取分享
DWPose Estimator 主要是识别真人的动作!如果是一些二次元或者直接的骨架图不行的 宽大衣服会导致提取骨架失败,如果用depth anything 搞二串联 apply controlnet会基于人物的裙子轮廓创建了,如图
stephen one
25 天前
人工智能
·
ai作画
·
stable diffusion
·
aigc
·
midjourney
2026 AI深度伪造危机:实测 Midjourney v7 与 Flux 2 Max 识别,谁才是 AI 检测的天花板?
步入 2026 年,随着 Midjourney v7 的电影感光影和 Flux 2 Max 的极致写实,AI 生成内容与真实摄影的边界已彻底模糊。传统的检测工具(如 CNNDetection 等)在面对现代 DiT (Diffusion Transformer) 架构时,识别率已大幅衰减。
长不大的蜡笔小新
1 个月前
stable diffusion
基于Stable Diffusion的多模态图像生成与识别系统
随着AI技术的快速发展,图像生成技术已经取得了突破性进展。Stable Diffusion作为当前最先进的扩散模型之一,能够根据文本描述生成高质量、多样化的图像。为了让更多用户能够便捷地使用这一技术,我开发了一款基于Stable Diffusion的多模态图像生成与识别工具,支持文字生图、图生图、局部重绘等多种功能,并提供了直观友好的Web界面。
米汤爱学习
1 个月前
笔记
·
stable diffusion
stable-diffusion-webui【笔记】
缺少的数据可以留言我会及时补齐 缺少的数据可以留言我会及时补齐 缺少的数据可以留言我会及时补齐链接: Nova Anime XL - IL v15.0 | Illustrious Checkpoint | Civitai 模型类型:Checkpoint (大模型/底模) 它是一个主模型,不是 Lora,不需要挂载在别的模型上,而是直接选它来画图。 核心架构:SDXL (Stable Diffusion XL) 注意:这不是老旧的 SD 1.5 模型。 使用要求:SDXL 模型通常很大(6GB左右),画图时