ComfyUI秋叶整合包安装JoyCaption

ComfyUI继承了开源软件的光荣传统，装点插件真的很不容易。

今天（2026/2/7）来讲讲装JoyCaption这个插件的经历。这个插件的作用是从图片反推出AI生图的提示词。

第一步很简单

使用秋叶整合包从ComfyUI Manager的插件列表里找到它，进行安装。

第二步下载模型

按照 https://github.com/1038lab/ComfyUI-JoyCaption 里的说法，有一个llama-joycaption-beta-one-llava-mmproj-model-f16模型是必须的。放到ComfyUI/Models/LLM/GGUF目录下。

llama-joycaption-beta-one-llava-mmproj-model-f16模型是多模态投影层，负责将图片转换为语言模型能理解的特征向量。没有它，模型"看不到"图片，只能文本生成。

其中：

mmproj = Multi-Modal Projection

GGUF 是 GPT-Generated Unified Format 的缩写，是一种专为大型语言模型（LLM）设计的量化模型格式。它由 llama.cpp 项目开发，旨在让大模型能在消费级硬件（尤其是 CPU 和普通显卡）上高效运行。

除了这个多模态投影层，大语言模型则有两个选择，

一个是标准模型：

另一个选择是下载GGUF的大语言模型：

标准模型是若干个safetensors文件，下载以后还要合并，很麻烦。此外从大小和效果上，都推荐安装GGUF模型，根据你的显存大小选一个即可。

第三步使用

启动ComfyUI，你会在AILab分类下找到5个JoyCaption Node：

但是问题来了，你刚才下载的GGUF模型，而这几个默认Node，是给标准模型用的。

给GGUF模型用的Node，叫JoyCaption GGUF。目前找不到。磨难开始。

第四步安装llama-cpp-python

在JoyCaption的目录（ComfyUI\custom_nodes\ComfyUI-JoyCaption）里找到Readme文件，其实里面写了，要用GGUF的大语言模型，必须安装llama-cpp-python（llama.cpp 项目催生了 GGUF 格式，而 llama-cpp-python 是它在 Python 上的封装。），且有两个选项：