基于Dify实现对Excel的数据分析--动态配置图表

在之前的Excel数据分析文章发出后,网友们都在咨询如何实现根据数据情况动态调整图表输出,其实这个不难,这几天抽空做了一个简单实现。主要原理就是在series模板中做工作,其他内容和之前文章类似,这里就不重复了,主要提供自定义代码完整内容。具体如下,供大家参考学习。

一、数据准备

准备一个Excel文件,内容可以是产品月度销售数据或者油气田月度产量数据等。如下图。

二、工作流程设计之自定义代码

自定义代码(Exl2Echart)代码,代码需要在sandbox容器中执行,目前主要支持python和nodejs代码,记得安装相应的依赖库。本文中的csv和json库都是默认安装的。代码详见下方

复制代码
import csv
import json
def main(csv_string):
    # 将CSV字符串分割成行
    lines = csv_string.strip().split('\n')
    # 使用csv模块读取数据
    reader = csv.reader(lines)
    # 将所有行转换为列表
    data = [row for row in reader]

    # 将数字字符串转换为浮点数
    for row in data[1:]:  # 跳过标题行,即第一行
	    # 将第二列及之后的所有列的数据类型调整为数字类型(这里是float)
        for i in range(1, len(row)):
            try:
                row[i] = float(row[i])
            except ValueError:
                pass
	# 根据数据情况动态增加图表配置。主要是修改series,这个其实与大模型无关。  
	custom_series=[]  
	# 1.柱状图:根据data行数增加series列表数据  
	for row in range(len(data)-1):  
	    # 第一个网格中的柱状图系列,取决于行数。  
	    type_schema={"type": "bar", "seriesLayoutBy": "row"}  
	    custom_series.append(type_schema)  
	# 2.折线图:根据data列数增加series列表数据  
	for row in range(len(data[0])-1):  
	    # 第二个网格中的折线图系列,取决于列数  
	    type_schema={"type": "line", "xAxisIndex": 1, "yAxisIndex": 1}  
	    custom_series.append(type_schema)
    # 创建完整的ECharts配置
    echarts_config = {
        "legend": {},
        "tooltip": {},
        "dataset": {
            "source": data
        },
        "xAxis": [
            {"type": "category", "gridIndex": 0},
            {"type": "category", "gridIndex": 1}
        ],
        "yAxis": [
            {"gridIndex": 0},
            {"gridIndex": 1}
        ],
        "grid": [
            {"bottom": "55%"},
            {"top": "55%"}
        ],
        "series": custom_series
    }
    # 生成输出文件,这里是echart要求的格式输出
    output = "```echarts\n" + json.dumps(echarts_config, indent=2, ensure_ascii=False) + "\n```"
    return {"output": output}
三、应用效果演示

运行工作流后,选择文件后启动对话,在对话框中输入"请分析Excel数据",即可实现如下效果。演示示例是2个油田4个月度数据,如果用户提供了更多的数据,该agent会自动解析数据,形成多列多行的图表数据,实现对Excel数据分析,大家可以试试。

相关推荐
白雪讲堂3 小时前
【GEO从入门到精通】生成式引擎与其他 AI 技术的关系
大数据·人工智能·数据分析·智能电视·geo
唐叔在学习8 小时前
Python NumPy入门指南:数据处理科学计算的瑞士军刀
python·数据分析·numpy·数组操作·python数据处理
逍岚子8 小时前
MCP第4章:常用mcp servers和使用案例
llm·agent·mcp
思绪漂移11 小时前
华为云 Flexus 部署 coze-studio
华为云·agent·maas·coze-studio
WSSWWWSSW11 小时前
Numpy科学计算与数据分析:Numpy广播机制入门与实践
python·数据挖掘·数据分析·numpy
yeshan33313 小时前
使用 iFLOW-CLI GitHub Action 和 Qwen3-Coder 给 GitHub 仓库生成幻灯片风格的文档站点
ai·agent
程序员柳1 天前
基于Flask + Vue3 的新闻数据分析平台源代码+数据库+使用说明,爬取今日头条新闻数据,采集与清洗、数据分析、建立数据模型、数据可视化
数据库·数据分析·flask
武汉格发Gofartlic2 天前
HFSS许可证常见问题及解决方案
大数据·运维·人工智能·数据分析·自动化