LLM之Agent(三):HuggingGPT根据用户需求自动调用Huggingface合适的模型

​ 浙大和微软亚洲研究院开源的HuggingGPT,又名JARVIS,它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型,然后去Huggingface上直接调用对应的模型,最终给出用户的解决方案。

一、HuggingGPT的工作流程

它的工作流程包括四个阶段:

  • **任务规划:**ChatGPT将用户的需求解析为任务列表,并确定任务之间的执行顺序和资源依赖关系;

  • **模型选择:**ChatGPT根据HuggingFace上托管的各专家模型的描述,为任务分配合适的模型;

  • **任务执行:**混合端点(包括本地推理和HuggingFace推理)上被选定的专家模型根据任务顺序和依赖关系执行分配的任务,并将执行信息和结果给到ChatGPT;

  • **响应生成:**最后,由ChatGPT总结各模型的执行过程日志和推理结果,给出最终的输出。

下表展示了HuggingGPT的具体细节:

不同任务的任务规划评估,如下表所示:

任务规划的格式是: [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}],参数的详细解释,如下表所示:

二、HuggingGPT的示例

假设我们有如下请求,来看一下HuggingGPT的完整流程:

请求:请生成一个女孩正在看书的图片,她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务,并分别选定模型执行得到最终结果的。

、**** HuggingGPT不同任务的实验效果

参考文献:

1\] https://github.com/microsoft/JARVIS \[2\] https://huggingface.co/spaces/microsoft/HuggingGPT \[3\] https://arxiv.org/abs/2303.17580 \[4\] https://twitter.com/DrJimFan/status/1642563455298473986

相关推荐
小兵张健8 小时前
Codex 切换 Provider 后恢复历史对话
chatgpt·openai·全栈
Lei活在当下14 小时前
借助Vibe Coding,我用周末两天开发了一套简历维护系统
chatgpt·openai·ai编程
Agent产品评测局18 小时前
企业流程异常处理自动化落地,预警处置全流程实现方案:2026企业“数字免疫系统”构建指南
运维·人工智能·ai·chatgpt·自动化
这儿有一堆花21 小时前
Pixel 与 iPhone 安全性对比:硬件芯片、系统更新和实际防护谁更可靠
人工智能·chatgpt
Maiko Star2 天前
Claude Code安装教程
java·chatgpt·claude code
Agent产品评测局2 天前
律所行业自动化平台选型,合同审核与案件管理优化 | 2026年法律科技Agent化演进与企业级智能体实测横评
运维·人工智能·科技·ai·chatgpt·自动化
王莎莎-MinerU2 天前
MinerU 生态全景:Skills、RAG、MCP、Cursor Rules
人工智能·深度学习·计算机视觉·chatgpt·pdf·软件工程
Agent产品评测局2 天前
酒店行业自动化工具选型,门店运营与客户服务优化:2026精细化运营的技术路径与实测横评
运维·人工智能·ai·chatgpt·自动化
洛阳吕工2 天前
2026 GEO 实战指南:从资料收集看 AI 搜索优化的核心变局
人工智能·chatgpt
赵钰老师2 天前
最新Hermes Agent 技能封装与科研自动化:以 Meta-Analysis 为例-实现从文献检索到绘图的一站式工作流
运维·chatgpt·自动化·ai编程·ai写作