免费开源的WPS AI插件 察元AI助手:generateMultimodalAsset:类型校验与分支派发

摘要

多模态任务根据 kind 分派到 generateImageAsset、generateSpeechAsset、generateVideoAsset。providerId/modelId 为空时抛错,提示先在设置中启用对应模型。

关键词

image;audio;video

扩展阅读与维护提示

本篇围绕「generateMultimodalAsset:类型校验与分支派发」组织材料。仓库内与主题最直接相关的检索词包括:image、audio、video。建议在阅读正文所列片段后,用 IDE 全局搜索这些符号,沿 import 与调用栈向上追问「谁在什么时机调用」,而不是只记住单文件路径。

摘要所概括的要点为:多模态任务根据 kind 分派到 generateImageAsset、generateSpeechAsset、generateVideoAsset。providerId/modelId 为空时抛错,提示先在设置中启用对应模型。落地到排障时,可把现象粗分为三类交叉验证:配置是否按预期写入持久化介质;WPS COM 上下文是否可用(例如是否缺少 ActiveDocument);以及网络与证书策略是否拦截了 fetch。本篇涉及的模块通常只覆盖其中一两类,需要与相邻篇目拼成完整拼图。

教程文件名「31-duomotai-renwu-yu-chatCompletion.md」仅用于导航与排序,不等价于源码模块名。若正文中的行号与本地分支不一致,多半因合并导致行偏移,此时应以函数名、导出名为锚重新检索;团队若维护了生成脚本,可在变更大段源码后重新运行以保持摘录大致对齐。

本文刻意避免对产品能力做营销式承诺:所述行为均以当前仓库可见实现为准。若组织策略要求离线或内网模型,应在网关、证书与代理层收口,而不是假设加载项能绕过浏览器安全模型。

若你同时阅读 docs/chayuan-llm-chain-series,可先对照其中的总体链路图理解「请求从 UI 到 chatApi」的次序,再回到本教程看数据结构、默认值与修改风险面;两者互补,不重复堆砌功能列表。

正文

1. 入口校验

kind 白名单与模型 id 非空检查。

阅读源码摘录时,请把它当作「定位入口」而非完整实现:同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前,建议用最小文档手工走一遍相关助手或对话框,并观察任务清单与日志中的字段是否与预期一致,再决定是否做数据迁移或配置重置。

复制代码
// src/utils/multimodalTaskRunner.js 第113-122行
export async function generateMultimodalAsset(options = {}) {
  const kind = String(options.kind || '').trim()
  if (!['image', 'audio', 'video'].includes(kind)) {
    throw new Error('未识别的多模态任务类型')
  }
  const providerId = String(options.providerId || '').trim()
  const modelId = String(options.modelId || '').trim()
  if (!providerId || !modelId) {
    throw new Error(`未找到可用的${getKindLabel(kind)}模型,请先在设置中配置并启用相应模型`)
  }

2. 图像分支

executionPrompt 与 aspectRatio 从 generationPlan 或 options 回填。

阅读源码摘录时,请把它当作「定位入口」而非完整实现:同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前,建议用最小文档手工走一遍相关助手或对话框,并观察任务清单与日志中的字段是否与预期一致,再决定是否做数据迁移或配置重置。

复制代码
// src/utils/multimodalTaskRunner.js 第126-137行
  if (kind === 'image') {
    const asset = await generateImageAsset({
      providerId,
      modelId,
      prompt: String(generationPlan.executionPrompt || options.prompt || '').trim(),
      aspectRatio: String(generationPlan.aspectRatio || options.aspectRatio || '').trim() || '16:9',
      signal: options.signal || null
    })
    return {
      ...asset,
      generationPlan
    }
相关推荐
tedcloud1232 小时前
UI-TARS-desktop部署教程:构建AI桌面自动化系统
服务器·前端·人工智能·ui·自动化·github
爱上纯净的蓝天5 小时前
Git 入门完全指南:从安装到第一次开源贡献
git·开源
曦月逸霜5 小时前
啥是RAG 它能干什么?
人工智能·python·机器学习
AI医影跨模态组学5 小时前
Lancet Digit Health(IF=24.1)广东省人民医院刘再毅&南方医科大学南方医院梁莉等团队:基于可解释深度学习模型预测胶质瘤分子改变
人工智能·深度学习·论文·医学·医学影像·影像组学
应用市场5 小时前
AI 编程助手三强争霸(2026 版):Claude、Gemini、GPT 各自擅长什么?
人工智能·gpt
UXbot5 小时前
AI原型设计工具如何支持团队协作与快速迭代
前端·交互·个人开发·ai编程·原型模式
AC赳赳老秦5 小时前
供应链专员提效:OpenClaw自动跟踪物流信息、更新库存数据,异常自动提醒
java·大数据·服务器·数据库·人工智能·自动化·openclaw
脑极体6 小时前
从Token消耗到DAA增长,AI价值标尺正在重构
人工智能·重构
csdn小瓯6 小时前
LangGraph自适应工作流路由机制:从关键词匹配到智能决策的完整实现
人工智能·fastapi·langgraph
QYR-分析6 小时前
高功率飞秒激光器行业发展现状、市场机遇及未来趋势分析
大数据·人工智能