LLM之Agent(三):HuggingGPT根据用户需求自动调用Huggingface合适的模型

​ 浙大和微软亚洲研究院开源的HuggingGPT,又名JARVIS,它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型,然后去Huggingface上直接调用对应的模型,最终给出用户的解决方案。

一、HuggingGPT的工作流程

它的工作流程包括四个阶段:

  • **任务规划:**ChatGPT将用户的需求解析为任务列表,并确定任务之间的执行顺序和资源依赖关系;

  • **模型选择:**ChatGPT根据HuggingFace上托管的各专家模型的描述,为任务分配合适的模型;

  • **任务执行:**混合端点(包括本地推理和HuggingFace推理)上被选定的专家模型根据任务顺序和依赖关系执行分配的任务,并将执行信息和结果给到ChatGPT;

  • **响应生成:**最后,由ChatGPT总结各模型的执行过程日志和推理结果,给出最终的输出。

下表展示了HuggingGPT的具体细节:

不同任务的任务规划评估,如下表所示:

任务规划的格式是: [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}],参数的详细解释,如下表所示:

二、HuggingGPT的示例

假设我们有如下请求,来看一下HuggingGPT的完整流程:

请求:请生成一个女孩正在看书的图片,她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务,并分别选定模型执行得到最终结果的。

、**** HuggingGPT不同任务的实验效果

参考文献:

1\] https://github.com/microsoft/JARVIS \[2\] https://huggingface.co/spaces/microsoft/HuggingGPT \[3\] https://arxiv.org/abs/2303.17580 \[4\] https://twitter.com/DrJimFan/status/1642563455298473986

相关推荐
来自星星的坤2 小时前
如何优雅地解决AI生成内容粘贴到Word排版混乱的问题?
人工智能·chatgpt·word
新加坡内哥谈技术11 小时前
MCP:人工智能时代的HTTP?探索AI通信新标准
人工智能·自然语言处理·chatgpt
没有梦想的咸鱼185-1037-16631 天前
【降尺度】ChatGPT+DeepSeek+python+CMIP6数据分析与可视化、降尺度技术与气候变化的区域影响、极端气候分析
python·chatgpt·数据分析
2301_787552871 天前
AI-Browser适用于 ChatGPT、Gemini、Claude、DeepSeek、Grok的客户端开源应用程序,集成了 Monaco 编辑器。
人工智能·chatgpt·自动化·编辑器·deepseek
没有梦想的咸鱼185-1037-16631 天前
解锁空间数据新质生产力暨:AI(DeepSeek、ChatGPT)、Python、ArcGIS Pro多技术融合下的空间数据分析、建模与科研绘图及论文写作
人工智能·python·深度学习·机器学习·arcgis·chatgpt·数据分析
量子位2 天前
o3 猜照片位置深度思考 6 分 48 秒全程高能,范围精确到 “这么近那么美”
人工智能·chatgpt
Want5953 天前
从ChatGPT到GPT-4:大模型如何重塑人类认知边界?
chatgpt·aigc
Awesome Baron3 天前
《Learning Langchain》阅读笔记8-RAG(4)在vector store中存储embbdings
python·jupyter·chatgpt·langchain·llm
张申傲3 天前
多模态(3):实战 GPT-4o 视频理解
人工智能·chatgpt·aigc·多模态
SLY司赖3 天前
大模型应用开发之LLM入门
语言模型·chatgpt·llm