数据分析是重要工具,它帮助我们洞察本质、发现规律并指导决策。然而数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 "与数据对话 "。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但实际上,在业务场景包罗万象、且绝对精确性要求极高的数据分析领域,不管是OpenAI的高级数据分析(原代码解释器,Code Interpreter),还是自行借助开源框架构建Text2SQL/Text2Code等解决方案,在应对较复杂、特别是领域特征明显的分析任务时,都远无法达到企业应用的高可用性要求。
微软推出了一个新的开源框架 - TaskWeaver,一款用于无缝规划与执行数据分析任务的、代码优先的Agent框架,能够有效协调各种自定义插件来完成自然语言描述的数据分析任务。TaskWeaver支持丰富的数据结构,支持用户封装自定义算法作为插件,整合领域特定知识提高任务执行的可靠性。
具体地说,Microsoft TaskWeaver它可以将自然语言请求转化为可执行的 Python 代码。它的最终目标是为能够自主规划和执行复杂任务的 AI 智能体提供支撑。该技术的工作方式是接收你的提示词,然后将其拆分为可执行步骤。接着,它会选择合适的插件来实现目标,生成用于执行计划的 Python 代码,在安全环境中运行代码,并返回结果。
大语言模型(LLM)本质上受其训练数据的限制。它们虽能生成文本、代码或多媒体内容,但输出始终基于过期的已有知识。此外,它们无法像人类用户那样与在线网页进行实时交互。这两点是当前 AI 模型的主要限制。
TaskWeaver 通过支持智能体集成自定义插件,帮助克服这些限制。你可以将插件理解为 LLM 可调用的专业工具,用于执行超出其内置能力范围的任务,从而有效扩展其适用范围与实际价值。通过调用这些插件,TaskWeaver 智能体生成的代码可以与外部环境交互并执行复杂操作。
下面的视频将实战讲述如何使用Bright Data 插件(该插件可以实时搜索网页、提取内容,并从热门站点获取结构化数据)去扩展 Microsoft TaskWeaver,实现网页数据的高效获取:
使用插件扩展 Microsoft TaskWeaver
Bright Data 为数据获取提供全方位的技术支持,为新用户提供了非常多的福利,注册即送30美元体验金,首充充多少赠多少,mcp每月免费5000次调用,机会难得,感兴趣的小伙伴快来试试吧!体验链接:体验