【AI学习-comfyUI学习-第二十一-LMSD线段预处理器(建筑概念设计图)-各个部分学习】
- 1,前言
- 2,说明
-
- [1,第二十一LMSD线段预处理器(建筑概念设计图)工作流](#1,第二十一LMSD线段预处理器(建筑概念设计图)工作流)
- 3,流程
- 4,模块介绍
- 二、现在用到的"模型"有哪些(重点)
-
- [1 LMSD 线段预处理器(重点模块)](#1 LMSD 线段预处理器(重点模块))
-
- 全名
- 它在干嘛(非常重要)
- [LMSD 参数含义(图里的)](#LMSD 参数含义(图里的))
- [2 ControlNet(LMSD 专用)](#2 ControlNet(LMSD 专用))
-
- [使用的 ControlNet 模型](#使用的 ControlNet 模型)
- 这个模型学的是什么?
- 5,细节部分
- 6,工作流链接
- 7,总结
1,前言
最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。
2,说明
1,第二十一LMSD线段预处理器(建筑概念设计图)工作流
这是一个:用 LMSD 把真实街景中的"直线结构"提取出来,再通过 ControlNet 强制扩散模型"按这些直线来画"的可控生成系统。
基于 LMSD 的线段结构提取模型,对真实城市图像中的建筑轮廓与道路边界进行抽象表示,并通过 ControlNet 将该结构信息作为强约束条件注入扩散生成过程,从而在保持空间几何一致性的前提下,实现真实城市场景的可控生成。
-
结构不跑
-
建筑、道路、边界稳定
-
适合真实城市场景 / 合成数据 / 泛化测试
| 模块 | 负责什么 |
|---|---|
| LMSD | 抽出"城市骨架" |
| ControlNet | 锁死骨架 |
| 主模型 | 往骨架上"长肉" |
| Prompt | 决定肉长什么样 |
| Sampler | 把噪声变成图 |
3,流程
(1)调用模块

(2)输出 提示词
使用了两种描述词,一种只是简单的
bash
building
另一种是复杂一点的
bash
anime, illustration, cartoon, painting,
cinematic lighting, dramatic shadows,
over-saturated colors,
crowded street, people walking, cars everywhere,
old town, european style,
night scene, sunset, golden hour,
distorted buildings, tilted horizon

(3)生成图片
(1)原图片

(2)生成图片
短的描述词,就比较抽象

(3)生成图片
长的描述词

(4)适用范围
- 城市街景
- 建筑群
- 无人机视角
- 道路 / 结构合成
- 视觉模型泛化验证
4,模块介绍
二、现在用到的"模型"有哪些(重点)
1 LMSD 线段预处理器(重点模块)
全名
LSD / LMSD(Line Segment Detection)
它在干嘛(非常重要)
专门提取"长直线结构"
比如:
- 建筑轮廓
- 窗框
- 路沿
- 墙体边缘
- 电线杆、路灯
📌 它和 Canny 的本质区别:
| 方法 | 提取内容 |
|---|---|
| Canny | 所有边缘(很杂) |
| LMSD | 有意义的"直线段" |
👉 对城市、建筑来说:
LMSD ≫ Canny
LMSD 参数含义(图里的)
-
阈值(0.10 / 0.10)
- 控制"哪些线算重要"
- 越低 → 线越多(但噪声也多)
-
分辨率:512
- 用于"线段检测"的计算尺度
- 不等于最终出图尺寸
👉 你这个设置是 偏稳、偏工程向的
2 ControlNet(LMSD 专用)
使用的 ControlNet 模型
control_v11p_sd15_mlsd.pth
这个模型学的是什么?
"当我看到这种线段分布时,图像结构应该长这样"
它学到的是:
- 线段 ↔ 建筑关系
- 线段 ↔ 空间结构
📌 注意:
- 它 不管颜色
- 不管风格
- 只管:结构对不对
5,细节部分
暂无
6,工作流链接
https://download.csdn.net/download/qq_22146161/92492634
7,总结
这也算各一个开始吧,我也在学习摸索中。