1flowbase模板：一键导入升级GLM5.2，deepseek 多模态

安装请看github仓库readme提供了docker环境下一键部署

之前组合模型使用方式，节点编排然后去路由，这样去做组合模型，但是这样其实太僵硬，所以我决定对1flowbase进行重磅升级，增加内置工具调用，简单来说将多模态LLM封装为一个内置工具，挂载到主力模型中如Deepseek V4 ，或者GLM 5.2 这样文本模型，当主力模型需要识别图片时候，调用工具多模型LLM，进行图片识别，识别后结果作为工具直接返回描述给主力模型。编排如：

GLM5.2 作为主力模型

或者Deepseek V4

感谢雷总对于1flowbase 虚拟模型赞助，Deepseek 这个功能我用来调试都干掉20块，给孩子点一个star，研发资金困难了。

实操

其实就是在LLM节点中开启工具注册：

自定义注册工具名字和标识，注意仅支持，大小写字母和数字下划线

如果文本模型塞入了图片，上游供应商会报错，说不支持，所以我们需要对于工具进行拦截：

bash 复制代码

[
  {
    "kind": "media_content_available",
    "media_kind": "image",
    "argument_path": [
      "media"
    ]
  }
]

拦截这部分目前只做了图片，后续会升级为动态配置拦截工具，这样就可以对于一些工具执行结果，强制拦截，改造返回给模型

然后我们需要配置工具传参，这部分会注册进入文本模型中，让文本模型进行传参

bash 复制代码

{
  "type": "object",
  "required": [
    "task"
  ],
  "properties": {
    "task": {
      "type": "string",
      "description": "给多模态模型的任务指示提示词"
    },
    "media": {
      "type": "array",
      "items": {
        "type": "object",
        "required": [
          "kind",
          "path",
          "source"
        ],
        "properties": {
          "kind": {
            "enum": [
              "image"
            ],
            "type": "string",
            "description": "媒体类型"
          },
          "path": {
            "type": "string",
            "description": "工作区内图片路径，例如 uploads/image_aionui_1781014667000.png"
          },
          "source": {
            "enum": [
              "workspace_path"
            ],
            "type": "string",
            "description": "媒体来源"
          }
        }
      },
      "description": "需要交给多模态模型处理的媒体引用"
    }
  }
}