「玩转 TableAgent 数据智能分析」实战数据分析演练

文章目录

TableAgent 可以免费体验,注册后可以免费使用5次,次数使用完了,可以认证申请增加次数(每天15次)
【TableAgent公测地址】

前言

数字化时代,数据分析的重要性犹如空气般无处不在。商业数据分析是数字化管理、智能决策的基础,同时数据分析又是一个专业性极强的工作,描述性分析、诊断性分析、预测性分析,会让大多数只会用 Excel 的人望而生畏。

九章云极 DataCanvas 公司自主研发的 TableAgent 数据分析智能体让大模型对个人生产力的赋能,从写纪要、做总结上升到新的台阶,只要会提问,就能成为一个高级的数据分析师,洞察数据奥秘。

TableAgent 功能亮点

人人都是数据分析师

TableAgent 为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时 TableAgent 也可以满足企业级数据的大规模、高性能分析的要求,这也是 Code Interpreter 目前的短板。

TableAgent 选择了难度更高的代码生成路线,创造性的提出专家模型组的方法来解决这些难题。

融合创新应用的新成果

本次 TableAgent 发布带来的另外一个重要能力是专业化微调,不同行业不同企业在数据分析上有专业的语言背景和分析模型的独特需求,通用的分析工具很难满足专业化的要求,对此 TableAgent 为能够企业提供专业化微调。

TableAgent 为此配套设计了 T+(Table Family)系统,能够高效的实现定制化的微调工作,同时系统具有自我迭代的能力,系统性的体系支撑更高效的实现数据分析各个环节的升级,让用户在无感知的情况下即可获得不断升级的数据分析体验。

TableAgent 使用介绍

进入平台可以看到如下截图,点击立即体验。

登陆

会进入到手机号+验证码登陆页面,如下图:

功能介绍

登陆成功后可以看到页面中分为内容区域和数据集区域。如下图:

用户可以根据自己的需求上传相关数据集文件,目前线上的 TableAgent 版本仅支持 CSV 格式的数据文件。

数据集上传之后,就可以在下方的输入框中录入想要发起的问题。

申请认证

点击页面右上角申请认证按钮,会打开下面页面,只需填写个人信息即可提交申请认证。

登陆成功免费用量是 5 条,申请认证成功之后,15 天之内,每天会有 15 条免费用量。申请认证页面如下:

介绍完基本功能,下面我们就一起实战使用一下。

实战数据集分析一

选择系统提供的样例数据中"Airbnb 民宿价格&评价" 模块。系统自动提供了 CSV 文件。

导入 CSV 文件数据

CSV 文件数据如下:

发起提问

我发起的提问是:我准备全家去东南亚旅行,我每天的预算在 200~500 美元之间,需要 3~6 个床位,目的地是 Thailand 和 Malaysia,去哪更划算呢?帮我画个图比较下性价比哈。

TableAgent 应答结果

TableAgent 针对本次会话耗时 40.8 秒,使用模型alaya 请求消耗 3846 个 Token, 响应消耗 2734 个 Token,共计 6580 个。

回答的结果非常详细,相当满意。

从数据中我们可以看出,Thailand 的平均价格为 255 美元,平均评分为 4.895,而 Malaysia 的平均价格为 315.667 美元,平均评分为 4.97333。这可能意味着在 Thailand 的价格相对较低,但评分相对较高,而 Malaysia 的价格相对较高,但评分也相对较高。

然而,这只是平均值,具体的房源价格和评分可能会因为房源的具体情况(如房源类型、设施、位置等)而有所不同。因此,如果您对价格和评分有特定的要求,建议您在选择房源时,不仅考虑价格和评分,还考虑其他因素,如房源类型、设施、位置等。

总的来说,如果您对价格和评分都有较高的要求,Thailand 可能是一个更好的选择,但如果您对其他因素也有较高的要求,Malaysia 可能是一个更好的选择。

贴切的服务

在问答结束,TableAgent 还基于当前问题提出了接下来可能感兴趣的问题。这样就可以当用户更加方便快捷的获取到自己想要的信息。

TableAgent 提供了 3 个备用问题,分别是:

  1. 哪些房源的折扣价格较低但评价较高,我可以尝试预订这些房源吗?
  2. 哪种类型的房源的价格更稳定,可以帮助我更好的控制预算?
  3. 哪种床型拥有最多的评价?

推荐问题提问

我们选择其中一个问题,接着进行提问。

在详情中列出了详细的流程以及代码,核心内容如下:

Alaya:

  • 计算每种类型房源的价格变动: 首先,从 df 中提取 Price(in dollar)Offer price(in dollar) 两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据 Title 列进行分组,计算每种类型的价格变动的平均值

  • 价格变动最小的房源类型: 从 df_price_diff 中找出 Price_Diff 列最小的行,取出对应的 Title 列的值

    首先,从df中提取'Price(in dollar)'和'Offer price(in dollar)'两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据'Title'列进行分组,计算每种类型的价格变动的平均值

    df['Price_Diff'] = abs(df['Price(in dollar)'] - df['Offer price(in dollar)'])
    df_price_diff = df.groupby('Title')['Price_Diff'].mean().reset_index()

    从df_price_diff中找出'Price_Diff'列最小的行,取出对应的'Title'列的值

    min_price_diff_title = df_price_diff.loc[df_price_diff['Price_Diff'].idxmin(), 'Title']

根据数据分析,价格变动最小的房源类型是"{min_price_diff_title}"。这意味着这种类型的房源的价格相对稳定,你可以更容易地根据自己的预算来控制预算。

实战数据集分析二

第二个数据分析,我们选择的方向是"全球大城市人口 2022-2023",分析人口增长最高是哪个城市?并且对增长率最高的前10名进行画图展示。信息如下图:

分析结果

根据我们的数据分析,人口增长率最高的城市是Lokoja,来自尼日利亚,人口增长率为6.11%。其次是Bujumbura,来自 Burundi,人口增长率为5.93%。第三是Xiongan,来自中国,人口增长率为5.85%。

以下是这些城市的人口增长率的条形图,可以更直观地看到各城市的人口增长情况:

从这些数据中,我们可以看出,尼日利亚的 Lokoja 市的人口增长率最高,达到了 6.11%,其次是 Burundi 的 Bujumbura 市和中国的 Xiongan 市,两人的人口增长率分别为 5.93% 和 5.85%。这四个城市的人口增长率都非常高,这可能意味着这些城市的人口正在快速增长。

然而,值得注意的是,这些数据只是基于当前的数据进行的分析,实际的人口增长可能会受到许多因素的影响,例如经济状况、政策调整等。因此,这些数据只能作为参考,不能完全决定一个城市的人口走势。

分析哪个城市的未来人口最多

根据我们的数据分析,人口增长最快的城市是Delhi。

我们通过计算每个城市的人口增长来得出这个结果。这是基于当前的人口和增长率。具体的数据如下:

City Pop2023 growthRate
0 Tokyo -78107.6184 -0.0021
1 Delhi 899297.7084 0.0273
2 Shanghai 709822.6344 0.0243
3 Dhaka 754312.5200 0.0325
4 Sao Paulo 192267.7560 0.0085
5 Mexico City 198304.8338
6 Cairo 441445.6800 0.0199
7 Beijing 441854.1442 0.0203
8 Mumbai 340744.2560 0.0160
9 Osaka -45632.2416 -0.0024

这个表格显示了每个城市的预计 2023 年人口。你可以看到,Delhi 的预计人口增长率最高,这意味着这个城市的人口将在未来几年中迅速增长。

请注意,这个预测是基于当前的人口和增长率,并且可能会有所变动。因为人口增长受到许多因素的影响,包括但不限于经济状况、政策、自然灾害等。因此,这个结果应被视为一种可能的预测,而不是绝对的确定。

总结

TableAgent,由九章云极 DataCanvas 自主研发,为企业提供私有化部署,安全高效。以代码生成为基础,让每个人都能成为高级数据分析师,轻松应对描述性、诊断性和预测性分析。其专业化微调和 T+ 系统满足不同行业的独特需求。

通过实战数据集分析,展示了 TableAgent 强大的数据分析能力。从 Airbnb 民宿价格比较到全球大城市人口增长,TableAgent 提供了直观详细的结果。用户友好的界面、方便的上传功能以及贴切的推荐问题服务使其在数据分析领域脱颖而出。

总体而言,TableAgent 是数字化时代数据分析的得力助手,将复杂的数据分析变得简单易行。

相关推荐
。puppy37 分钟前
HCIP--3实验- 链路聚合,VLAN间通讯,Super VLAN,MSTP,VRRPip配置,OSPF(静态路由,环回,缺省,空接口),NAT
运维·服务器
颇有几分姿色1 小时前
深入理解 Linux 内存管理:free 命令详解
linux·运维·服务器
EricWang13582 小时前
[OS] 项目三-2-proc.c: exit(int status)
服务器·c语言·前端
算法与编程之美2 小时前
文件的写入与读取
linux·运维·服务器
武子康3 小时前
大数据-212 数据挖掘 机器学习理论 - 无监督学习算法 KMeans 基本原理 簇内误差平方和
大数据·人工智能·学习·算法·机器学习·数据挖掘
Q8137574604 小时前
数据挖掘在金融交易中的应用:民锋科技的智能化布局
人工智能·科技·数据挖掘
JaneJiazhao4 小时前
HTTPSOK:SSL/TLS证书自动续期工具
服务器·网络协议·ssl
布说在见4 小时前
魅力标签云,奇幻词云图 —— 数据可视化新境界
信息可视化·数据挖掘·数据分析
萨格拉斯救世主4 小时前
戴尔R930服务器增加 Intel X710-DA2双万兆光口含模块
运维·服务器
无所谓จุ๊บ4 小时前
树莓派开发相关知识十 -小试服务器
服务器·网络·树莓派