保姆级教程：将N8N升级为“全模态”神器，看图、听音样样行！

今天咱们来聊个超酷的功能：如何让你的 n8n 工作流"长眼睛"和"长耳朵"？ 🧐

很多朋友在用 n8n 搭建 AI 应用时，发现不论怎么折腾，好像只能发文字。想发张图片让 AI 分析？或者发段语音让 AI 听听？对不起，不支持。🚫

别急！今天这篇教程就手把手教你，如何利用 全模态（Multimodal） 大模型，让你的 n8n 支持文本、图片、音频、视频的上传与多轮对话！

举个栗子 🌰：

我给 AI 发一张海报图，问它："图里写了啥？"

它立马告诉我："N8N 2.0 发布了"

是不是很赞？只要掌握了这个方法，音视频分析也统统不在话下！

废话不多说，咱们直接上干货！👇

视频演示

首先，我们需要一个入口。

在 n8n 中添加 Chat Trigger （聊天触发器）节点。

⚠️ 注意： 默认情况下，这个聊天窗口只有"发送"按钮，是不支持上传附件的。

怎么破？

在 Chat Trigger 的设置里，找到 Allow File Uploads（允许上传文件）选项，把它打开！✅

设置好后，你会发现你的聊天窗口多了一个回形针图标 📎（或者上传按钮）。这就意味着，你的通道已经打通了，可以接受图片、音频和视频啦！

即使通道通了，如果你的大模型是个"脸盲"或者"听不懂"，那也没用。所以，我们需要一个支持全模态的大模型。

在 n8n 流程中：

下一步添加节点： 这里一定要选 AI Agent ！
- 敲黑板：千万别选 Basic LLM Chain，那个通常只支持纯文本，不支持多模态操作。🙅‍♂️
设置 Model： 在 AI Agent 里，我们需要配置一个 Chat Model（聊天模型）。

我们要选哪个模型呢？这就得用到阿里的百炼平台了。

关键操作来了（必看）： 🛠️

因为 n8n 原生可能没有直接的"百炼"节点，或者为了通用性，我们这里使用 OpenAI Chat Model 节点来"伪装"接入。因为百炼平台完美兼容 OpenAI 的协议！

操作步骤：

添加凭证 (Credentials)：
- 去阿里云百炼平台，注册并登录。
- 在"API-KEY管理"里创建一个新的 Key，复制下来。
- 在 n8n 的 OpenAI 凭证里，把这个 Key 填进去。
修改 Base URL：
- 在百炼的模型广场找到 Qwen-Omni，点击"API参考"。
- 复制那个 Base URL 地址。
- 粘贴到 n8n 凭证设置里的 Base URL 栏目中。
连接测试： 点击 Save/Test，看到绿色小对勾 ✅ 就说明连接成功！

连接成功后，回到 n8n 的 OpenAI Model 节点：

测试开始！ 🚀

结果展示：

大模型迅速识别并回复："这张图片显示的是 n8n 2.0 发布了。"

我核对了一下原图，完全相符！ 💯

想要实现 n8n 全模态，必须满足两个条件，缺一不可：

搞定这两步，你的 n8n 就不再是只会打字的机器人，而是能看能听的超级助手了！视频和音频的原理是一样的，大家课后可以自己去试一试。

好啦，今天的教程就到这里。我是磊哥，咱们下期再见！ 👋

觉得有用的话，记得点个在看支持一下哦！ ❤️

本文已收录到我的技术小站 www.javacn.site，网站包含的内容有：LangChain/N8N/SpringAI/SpringAIAlibaba/LangChain4j/Dify/Coze/AI实战项目/AI常见面试题等技术分享，欢迎各位大佬光临指导~