我把经验写成工作流，将输出做成可复用的系统

这一年，我写博客的目标越来越清晰：不是"分享一个技巧"，而是把它变成一段能跑起来的链路，最后沉淀为别人也能照着复刻的方案。

所以会看到我写的内容跨度很大：AIGC 工具平台、Dify / n8n 自动化、Coze 内容生产、数字人/语音、ComfyUI 图像与视频生成、甚至 KPI 指标体系。但它们并不散，反而像一条逐步完整的流水线：先把工具补齐，再把流程串起来，然后把多模态产出做稳定，最后把经验沉淀到平台上，让更多人拿来即用。

文章目录

从"写文章"到"做交付"
把常见需求做成模块
工作流让能力跑起来并可复刻
[语音 + 数字人 + 视频生产链路](#语音 + 数字人 + 视频生产链路)
ComfyUI从"能出图"到"视频可控一致性化"
[CSDN 如何放大我的分享价值](#CSDN 如何放大我的分享价值)
[2026 我想继续做的事](#2026 我想继续做的事)

从"写文章"到"做交付"

如果只看标题，这一年像"什么都写"；但如果把文章当成项目日志，会更像我在做一件事：把零散能力产品化。

比如我会把同类内容集中沉淀成"工具箱/平台"，再围绕平台把关键步骤拆成模块（下载、转写、切分、混剪、去重、出片），最后把模块串成工作流（自动生成、自动分发、自动入库、自动归档）。这套写法的变化很明显：文章不再只是讲功能点，而是在讲"怎么把能力落进真实链路里"。

把常见需求做成模块

这一年我在"工具模块"上的核心思路，是把内容生产里最容易卡住的环节做成可复用、可组合、可接入工作流的能力块。它们覆盖了从"素材怎么来"到"素材怎么变得可用"，再到"如何把内容进一步规模化生产"的关键前置步骤。这样做的好处是：一方面我自己在做内容时能减少重复劳动，另一方面读者也能按需取用，先解决眼前最痛的一个点，再逐步把整条链路搭起来。接下来我把这部分沉淀按三个高频问题归类：素材入口、素材清洗与结构化、生产基建，每一类都对应我在 2025 年持续打磨的具体文章与实践。

第一类是素材入口。很多时候不是不会做内容，而是卡在"素材怎么稳定拿到手"。所以我把下载这一步拆出来，针对不同来源给出可用方案，让获取素材这一步变成确定性动作，而不是靠运气。

推荐阅读

推荐文章	一句话看点
AIGC工具平台-YouGet视频下载	素材入口方案 1：把下载写成可复刻流程
AIGC工具平台-YtDlp某管视频下载	素材入口方案 2：适合多来源采集与补位

第二类是素材清洗与结构化。素材到手只是开始，真正决定效率的是能不能把长内容快速变成"可用片段"，并且让素材在后续混剪、重组、封面/人物处理时更省力。因此我把"切割、过滤、剪辑、去重、抠图、图像修复与提示词处理"等这类高频动作沉淀成模块，保证输入干净、输出可控。

推荐阅读

推荐文章	一句话看点
AIGC工具平台-音视频内容自由过滤分割	快速提取有效片段，降低人工筛选成本
AIGC工具平台-视频场景动态切割	按场景切割，更利于混剪/重组与批量化
AIGC工具平台-文稿AI视频混剪	从文稿到混剪成片：把"内容重组"做成步骤化流程
AIGC工具平台-视频AI介绍自动剪辑	自动剪辑思路：降低"从素材到成片"的人工成本
AIGC工具平台-视频克隆（纯解说）	复用结构与风格的典型模块（偏解说类）
AIGC工具平台-批量视频综合去重	批量去重：面向分发安全与内容差异化
AIGC工具平台-通用抠图换背景	抠图换背景：人像/商品/封面制作的高频需求
AIGC工具平台-通用图像缩放	尺寸适配：封面、平台规格、素材统一处理
AIGC工具平台-图像反推关键词描述	反推提示词：把"看不懂的图"变成可复现的描述
AIGC工具平台-描述关键词润色	提示词润色：提升可控性与一致性（偏生产实用）
AIGC工具平台-无AI感图像精修	精修增强：面向"更像真实素材"的处理
AIGC工具平台-旧照片修复上色	修复上色：内容素材增强与情绪价值型场景
AIGC工具平台-图片转换线稿	线稿化：适合二创、漫画/设计类素材处理
AIGC工具平台-最美证件照	证件照：人像处理的标准化需求模块

第三类是生产基建。像 ASR 音频转文本、TTS 文本转语音、以及更进一步的"零样本语音合成/声音克隆"，看起来基础，但它们决定了字幕、脚本整理、口播、批量化生产能不能稳定跑起来。我把这类能力单独写清楚，是为了让后续链路能更稳、更容易规模化。

推荐阅读

推荐文章	一句话看点
AIGC工具平台-通用文本转语音	TTS 基建：口播与批量视频生产的基础能力
AIGC工具平台-通用音频转文本	ASR 基建：字幕生成、脚本清洗、口播链路都离不开
AIGC工具平台-短剧解说FunAsr	解说类场景的 ASR 处理思路与实践
AIGC工具平台-CosyVoice多语言语音合成	多语言语音合成：适配更多内容方向
AIGC工具平台-IndexTTS零样本语音合成	零样本 TTS：更适合做角色化口播
AIGC工具平台-FishSpeech零样本语音合成	零样本 TTS 的另一方案：增强可替换性
AIGC工具平台-XTTS语音合成	多场景语音合成：口播与多角色适配
AIGC工具平台-F5TTS零样本语音合成	零样本 TTS 补充方案：丰富工具箱
AIGC工具平台-FireRedTTS零样本语音合成	零样本 TTS 补充方案：便于对比与选型
AIGC工具平台-GPT-SoVITS-v4-TTS音频推理克隆	声音克隆/推理：打造固定"声音资产"
AIGC工具平台-MockingBird声音克隆	声音克隆：更贴近"角色化内容生产"
AIGC工具平台-So-VITS-SVC声音克隆	SVC 方向：声音迁移与风格化能力补位
AIGC工具平台Tauri+Django开源git项目介绍和使用	从整体理解"为什么要平台化"：模块如何组织与复用
AIGC工具平台Tauri+Django环境开发，支持局域网使用	环境搭建：让工具"跑得起来、别人也能跑"
AIGC工具平台Tauri+Django常见错误与解决办法	排错汇总：提高复现成功率，减少踩坑成本
AIGC工具平台Tauri+Django内容生产介绍和使用	内容生产侧的使用说明：更贴近"怎么用它做产出"

工作流让能力跑起来并可复刻

这一年我在"工作流"这个模块上的重点，是把前面那些零散的能力（下载、处理、生成、存储、发布）用编排工具串成可复刻的链路 。整体上我主要沿着三条线在沉淀：用 Dify 做"场景化应用汇总与能力编排"，用 n8n 做"跨平台自动化与分发闭环"，用 Coze 做"偏内容生产的视频工作流模板化"。这些内容的共同点是：不只讲一个节点怎么用，而是把从输入到输出的路径固定下来，方便自己复用，也方便读者照着搭起来。

第一类是 Dify：把能力按场景归类，沉淀成"可直接套用"的工作流入口。这一块我更强调"体系化"：把图像/视频、语音/音频、数据采集、文档处理、企业运营等常用方向整理成汇总入口，读者可以从一个入口快速找到同类方案，再按需改成自己的业务流。

推荐阅读

推荐文章	一句话看点
【Dify】【图像与视频处理】工作流应用汇总	图像/视频方向的工作流入口集合，适合做生产链路底座
【Dify】【语音与音频】工作流应用汇总	TTS/ASR 等音频链路汇总，方便对接口播与多模态
【Dify】【数据采集与自动化】工作流应用汇总	抓取、清洗、自动化处理的工作流入口
【Dify】【文档与数据处理】工作流应用汇总	文档结构化、表格/数据处理类的常用工作流
【Dify】【企业自动化与运营】工作流应用汇总	面向运营与企业流程的自动化工作流集合
【Dify】【数据分析与可视化】工作流应用汇总	数据分析相关的工作流入口，适合接 BI/报表类需求

第二类是 n8n：把"生成---存储---发布---入库"做成自动化闭环。这一块更偏执行层：我会把短视频生成、多平台分发、文件自动归档（云盘/Notion/Airtable）以及网页抓取与订阅生成这类任务做成可迁移的流程，让内容产出后能自动流转到目标平台与存储位置。

推荐阅读

推荐文章	一句话看点
【n8n】多平台视频自动化发布应用	解决"做完怎么发"的最后一公里，适合矩阵分发
【n8n】AI短视频生成与多平台分发应用	从生成到分发的一条龙思路，偏内容生产闭环
【n8n】文本生成视频并自动上传Google云盘	输出自动归档，适合把素材沉淀成资产库
【n8n】Transform Markdown 到 Notion 的全自动化应用	内容结构化入库，让知识沉淀更省事
【n8n】PDF发票自动解析与Airtable入库应用	文档解析→结构化入库的典型模板
【n8n】自动化网页博客抓取与RSS订阅生成应用	抓取与订阅生成，适合做信息流自动化
【n8n】网络获取CSV自动转换为Excel	数据文件自动转化与交付，偏"数据搬运流水线"

第三类是 Coze：把内容生产流程做成可复用的视频工作流模板。这一块更像"内容型工作流库"：我会把一类视频的生产逻辑固定下来（脚本→画面→配音/字幕→成片），再按主题做不同模板，比如火柴人系列、书单/历史故事、英语内容等。并且不少工作流配了资源交付，读者可以直接拿到模板复现与修改，这也是我在平台上分享经验时很看重的一点。

推荐阅读

推荐文章	一句话看点
【Coze】在Coze平台使用源码创建工作流	从"会用"到"能复刻"：工作流导入/复用的关键步骤
【Coze】【视频】火柴人减肥励志工作流	成熟模板之一，且配套资源交付，适合直接复用
【Coze】【视频】火柴人蓝底工作流	同系列模板扩展，适合做风格统一的批量内容
【Coze】【视频】火柴人认知觉醒工作流	主题化模板案例，适合"系列栏目化"生产
【Coze】【视频】假如书籍会说话工作流	书单/阅读方向的可复用模板
【Coze】【视频】历史故事工作流	故事类内容模板，适合持续更新的内容结构
【Coze】【视频】每日英语工作流No.1	教育类短内容模板，适合固定节奏输出

语音 + 数字人 + 视频生产链路

这一年我在「语音 + 数字人 + 视频生产链路」上的沉淀，核心目标只有一个：把"说话"这件事做成可规模化的生产能力。我把语音能力（ASR/TTS/声音克隆）作为底座，把音频驱动数字人作为"呈现层"，再把它们接入视频生成/剪辑流程，让内容从脚本到成片能更稳定地跑起来。下面按三个高频问题归类，每一类都配了对应的推荐文章，方便按需直接跳转复现。

第一类是语音能力（TTS/ASR/零样本/克隆）。这一块解决的是"内容怎么开口说话"。从通用音频转文本（用于字幕、脚本整理）到多语言语音合成（用于多语种内容），再到零样本语音合成与声音克隆（用于固定角色/固定声线的长期输出），这一年我把可用方案尽量做成"能跑、能换、能对比"的工具栈，为后面的数字人口播与批量视频生产提供稳定输入。

推荐阅读

推荐文章	一句话看点
AIGC工具平台-通用音频转文本	ASR 基建：字幕、脚本清洗、口播流程都离不开
基于CosyVoice的多语言语音合成	多语言 TTS：适配更多内容方向与人群
基于IndexTTS的零样本语音合成	零样本 TTS：更适合做角色化/固定声线口播
基于FishSpeech的零样本语音合成	零样本方案补位：增强可替换性与选型空间
基于XTTS的语音合成	更通用的语音合成路径：适合多场景接入
基于F5TTS的零样本语音合成	零样本补充方案：便于对比效果与部署体验
基于FireRedTTS的零样本语音合成	零样本补充方案：丰富工具箱、提高可用性
基于GPT-SoVITS语音合成	声线资产化：更贴近"角色声音"的生产需求
基于So-VITS-SVC语音合成	声音转换/迁移：做声音风格化与变化的常用路线

第二类是数字人（对口型/同步/实时交互）。这一块解决的是"声音怎么变成可呈现的视频形象"。我重点围绕音频驱动对口型数字人做了多方案实践：不同项目在稳定性、效果、部署成本和可交互性上各有取舍，所以我倾向于把它们写成"可复现的对比路线"，方便读者按场景选型（口播、讲解、虚拟主播、实时互动等）。

推荐阅读

推荐文章	一句话看点
音频驱动数字人13款深度评测	先看评测再选型：把工具差异与适用场景讲清楚
基于DINet的音频对口型数字人	音频驱动对口型的一条经典路线，适合入门理解链路
基于SadTalker的音频对口型数字人	常用对口型方案：上手门槛相对友好
基于Duix.Heygem的音频对口型数字人	另一种实现思路：用于扩展方案与效果对比
基于LatentSync的音频对口型数字人	同步方向补充：更关注"对齐与一致性"的体验
基于LiveTalking的实时交互数字人	从"生成视频"走向"实时互动"的关键路线

第三类是视频生产链路（从脚本到成片）。这一块解决的是"把语音与数字人放进完整的视频流水线"。我更关注链路是否闭环：脚本怎么来、配音怎么做、人物怎么说、画面怎么动、最后怎么成片。为了让链路更可复用，我一方面用 Coze 做视频类工作流模板（适合快速批量产出），另一方面把语音能力与视频生成能力进一步组合（比如把 IndexTTS 口播接到视频生成里），把"会说话的内容"做成更可交付的成片方案。

推荐阅读

推荐文章	一句话看点
【Coze】在Coze平台使用源码创建工作流	工作流复用入口：学会导入/复刻，模板才能规模化
【Coze】【视频】每日英语工作流No.1	固定节奏栏目模板：适合长期稳定更新
【Coze】【视频】每日英语工作流No.2	模板升级版：更贴近批量化与持续迭代
【Coze】【视频】假如书籍会说话工作流	"内容会说话"的典型链路：脚本→配音→成片结构清晰
【Coze】【视频】火柴人减肥励志工作流	可复用视频模板：适合做系列化内容生产
【Coze】【视频】情感混剪工作流	混剪类链路模板：更贴近短视频分发场景
【ComfyUI】Wan2.2 + IndexTTS 图像数字人或动物口播视频生成	把"口播语音"直接接进视频生成：更像生产级组合方案

ComfyUI从"能出图"到"视频可控一致性化"

这一年我在 ComfyUI 方向的沉淀，可以用一句话概括：从"把图跑出来"，逐步走到"把图做可控"，再到"把视频做连贯、可运镜、可复用"。我不再只追求单张效果，而是更关注三件事：出图效率与稳定性 、人物/风格一致性与可编辑性 、以及 视频生成的可控与连贯。下面按这三个高频问题归类，每一类都有对应的推荐文章，方便直接照着复现。

第一类是 出图底座与效率。这部分解决的是"稳定出图 + 跑得动 + 跑得快"。我主要围绕 Flux / SD3.5 的基础工作流、低显存量化版本，以及结合 ControlNet 做结构约束，让出图更稳、更可控，也更适合做批量化生产的底座。

推荐阅读

推荐文章	一句话看点
【ComfyUI】Flux 完整版文生图	出图底座：标准 Flux 文生图流程
【ComfyUI】Flux + Schnell 完整版文生图	效率向版本：更快的生成节奏
【ComfyUI】Flux Fp8 低显存量化版文生图	低显存方案：更容易在普通显卡跑起来
【ComfyUI】Flux + ControlNet 边缘引导图生图	结构控制：边缘约束让构图更可控
【ComfyUI】Flux + ControlNet 深度引导图生图	空间控制：深度约束更稳地还原布局
【ComfyUI】Flux 图像8K放大	清晰度补强：放大与细节增强
【ComfyUI】SD3.5 基础文生图	另一条底座：SD3.5 的基础出图流程
【ComfyUI】SD3.5 + ControlNet 边缘引导图生图	SD3.5 的结构控制版本，适合稳构图

第二类是 可控编辑与一致性。这部分解决的是"同一个人能不能一直是同一个人、风格能不能统一、想改局部能不能不崩"。我重点围绕 QwenImageEdit 做人物一致性（九宫格、多视角、8 视角），并补充参考图一致性与局部重绘这类"生产级"能力，让结果更接近可交付的素材。

推荐阅读

推荐文章	一句话看点
【ComfyUI】QwenImageEdit 基础图生图	编辑底座：从"能改图"开始建立能力
【ComfyUI】QwenImageEdit 基础人物9宫格一致性写真	一致性入门：同一人物多图输出
【ComfyUI】QwenImageEdit 任意场景人物一致性写真	场景迁移：换背景也尽量保持同一人
【ComfyUI】QwenImageEdit 参考图写实8视角写真	生产级需求：8 视角常用镜头一致性
【ComfyUI】QwenImageEdit 连续式叙事分镜图生图	分镜/故事板：连续画面叙事更顺
【ComfyUI】Flux + LoRA + Pulid 参考图引导一致性图生图	参考图约束：把人物/风格拉回同一条线
【ComfyUI】Flux 局部重绘	精修能力：只改局部，整体不崩
【ComfyUI】QwenImageEdit 一致性洗图	一致性修复：把"跑偏的图"拉回可用

第三类是 视频生成的可控与连贯。这部分解决的是"视频能不能连贯、镜头能不能控、过渡能不能丝滑"。我以 Wan2.2 的文生视频/图生视频为底座，重点沉淀首尾帧控制、SmoothMix 电影质感、运镜控制（SceneMotion/FunCamera），以及多元素变装与关键帧序列这类更接近"可编排视频效果"的模块，让视频更像可生产的资产，而不是一次性实验。

推荐阅读

推荐文章	一句话看点
【ComfyUI】Wan2.2 基础文生视频	视频底座：从文本生成视频的基础流程
【ComfyUI】Wan2.2 基础图生视频	图生视频底座：用图片驱动视频更易控
【ComfyUI】Wan2.2 SmoothMix 首尾帧电影质感视频生成	电影感与连贯性：首尾帧控制更稳
【ComfyUI】Wan2.2 首尾帧平滑过渡视频生成	过渡更丝滑：解决首尾跳变问题
【ComfyUI】Wan2.2 SceneMotion 运镜控制图生视频	运镜可控：把镜头运动变成参数
【ComfyUI】Wan2.2 FunCamera 镜头运动控制	镜头玩法：更丰富的运动控制思路
【ComfyUI】Wan2.2 ElementMorph 多元素变装图生视频	多元素变化：适合变装/形变类视频
【ComfyUI】Wan2.2 SmoothMorph 首尾帧关键帧序列图生视频	关键帧序列：让变化更连续、更可控
【ComfyUI】Wan2.2 智能关键词驱动图像超分视频生成	超分与增强：提升画质与可用性
【ComfyUI】QwenImageEdit + Wan2.2 写真套图短视频生成	把一致性写真接入视频：从套图走向短视频

CSDN 如何放大我的分享价值

这一年我越来越确定：CSDN 对我来说不只是"发文章的地方"，更像一个把经验做成资产、把资产持续放大的场。它帮我把零散实践变成体系（方便读者按路径学习），把方案变成可交付物（读者能直接复现），也把传播与反馈变成闭环（内容能扩散、也能被纠错迭代）。下面我按三个最直观的"放大点"来总结，并各自配上对应的推荐文章。

第一类是把内容从"单篇"变成"体系入口"。很多技术分享写着写着会散，因为读者不知道从哪里开始，也不知道同类文章在哪。CSDN 的专栏/分类与可检索结构，让我可以把同一方向的内容做成"汇总入口"，读者从入口进来就能顺着链路学习，我自己后续更新也能持续往同一体系里补齐，而不是每次重新解释背景。

推荐阅读

推荐文章	一句话看点
【Dify】【图像与视频处理】工作流应用汇总	把图像/视频类工作流集中成入口，读者不需要翻帖找
【Dify】【语音与音频】工作流应用汇总	语音链路体系化整理，后续口播/多模态更容易接上
【Dify】【数据采集与自动化】工作流应用汇总	抓取→处理→自动化的场景入口，适合做"信息流水线"
【Dify】【文档与数据处理】工作流应用汇总	文档/表格/数据处理类场景的统一入口
【Dify】【企业自动化与运营】工作流应用汇总	把自动化从"工具"写成"业务场景"，更容易落地
【Dify】【数据分析与可视化】工作流应用汇总	数据分析类工作流入口，方便持续补齐同类案例

第二类是把经验从"看懂"变成"拿走就能用"。很多时候读者缺的不是理解，而是"可复现"。CSDN 的资源下载与附件承载，让我能把工作流模板、素材、配套文件直接交付出去；再配合文章步骤，读者就能更快跑通。这也反过来提升了我的写作标准：不仅讲怎么做，还要保证别人能做成。

推荐阅读

推荐文章	一句话看点
【Coze】【视频】火柴人减肥励志工作流	文章 + CSDN 资源下载，工作流模板可直接复用
【Coze】【视频】每日英语工作流No.1	固定栏目型模板，配套资源更利于复刻与迭代
【Coze】【视频】每日英语工作流No.2	模板升级版，同样可通过资源交付快速跑通
AIGC工具平台Tauri+Django开源git项目介绍和使用	直接给到开源与落地路径，读者更容易照着搭
AIGC工具平台Tauri+Django环境开发，支持局域网使用	把环境搭建写透，降低"装不起来"的失败率
AIGC工具平台Tauri+Django常见错误与解决办法	用"踩坑清单"提升复现成功率，是交付型内容的关键

第三类是把影响力从"站内阅读"扩展到"站外传播 + 反馈迭代"。我很看重一个事实：同一份经验，在不同平台会遇到不同受众，也会得到不同反馈。CSDN 作为主阵地，适合把内容写完整、写系统；再通过同步到知乎/头条或配合视频演示，内容就能自然外溢，带来更多讨论与纠错，最后再回流到文章里持续迭代。

推荐阅读

推荐文章	一句话看点
坑多路难走，学数据分析转行前要知道培训机构不会说的事情	典型"站内沉淀 + 站外传播"的内容形态（清单里含知乎/头条链接）
给还在迷茫的你分享我从零基础的日语文科生半路出家搞Python如何上岸的	经验型内容更容易跨平台触达不同人群（清单里含知乎链接）
图像识别和目标检测技术如何改变世界的视觉魔法	技术科普向内容在站外更容易获得增量曝光（清单里含头条链接）
基于FastGPT搭建本地DeepSeek R1服务+AI专属知识库	文章沉淀为主，配合演示视频扩散与验证（清单里含B站链接）
【n8n】多平台视频自动化发布应用	直接面向"分发闭环"，天然契合多平台传播需求
【Coze】【视频】情感混剪工作流	内容型工作流更适合跨平台验证与迭代优化

2026 我想继续做的事

2025 我做对的一件事，是把写作当成工程：能复用、能迭代、能交付。

2026 我想继续往两个方向推：

把已经跑通的链路，补齐"部署、成本、稳定性、版本管理"这些更生产化的细节（让它更像可落地方案）。
把专题做得更像"课程路径"：读者从 0 到 1 顺着目录就能跑通，而不是看完一篇就散。

如果说这一年最大的收获是什么，我会把它归结为一句话：平台让我把经验从"写出来"，变成了"沉淀下来"。