「玩转 TableAgent 数据智能分析」实战数据分析演练

文章目录

TableAgent 可以免费体验,注册后可以免费使用5次,次数使用完了,可以认证申请增加次数(每天15次)
【TableAgent公测地址】

前言

数字化时代,数据分析的重要性犹如空气般无处不在。商业数据分析是数字化管理、智能决策的基础,同时数据分析又是一个专业性极强的工作,描述性分析、诊断性分析、预测性分析,会让大多数只会用 Excel 的人望而生畏。

九章云极 DataCanvas 公司自主研发的 TableAgent 数据分析智能体让大模型对个人生产力的赋能,从写纪要、做总结上升到新的台阶,只要会提问,就能成为一个高级的数据分析师,洞察数据奥秘。

TableAgent 功能亮点

人人都是数据分析师

TableAgent 为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时 TableAgent 也可以满足企业级数据的大规模、高性能分析的要求,这也是 Code Interpreter 目前的短板。

TableAgent 选择了难度更高的代码生成路线,创造性的提出专家模型组的方法来解决这些难题。

融合创新应用的新成果

本次 TableAgent 发布带来的另外一个重要能力是专业化微调,不同行业不同企业在数据分析上有专业的语言背景和分析模型的独特需求,通用的分析工具很难满足专业化的要求,对此 TableAgent 为能够企业提供专业化微调。

TableAgent 为此配套设计了 T+(Table Family)系统,能够高效的实现定制化的微调工作,同时系统具有自我迭代的能力,系统性的体系支撑更高效的实现数据分析各个环节的升级,让用户在无感知的情况下即可获得不断升级的数据分析体验。

TableAgent 使用介绍

进入平台可以看到如下截图,点击立即体验。

登陆

会进入到手机号+验证码登陆页面,如下图:

功能介绍

登陆成功后可以看到页面中分为内容区域和数据集区域。如下图:

用户可以根据自己的需求上传相关数据集文件,目前线上的 TableAgent 版本仅支持 CSV 格式的数据文件。

数据集上传之后,就可以在下方的输入框中录入想要发起的问题。

申请认证

点击页面右上角申请认证按钮,会打开下面页面,只需填写个人信息即可提交申请认证。

登陆成功免费用量是 5 条,申请认证成功之后,15 天之内,每天会有 15 条免费用量。申请认证页面如下:

介绍完基本功能,下面我们就一起实战使用一下。

实战数据集分析一

选择系统提供的样例数据中"Airbnb 民宿价格&评价" 模块。系统自动提供了 CSV 文件。

导入 CSV 文件数据

CSV 文件数据如下:

发起提问

我发起的提问是:我准备全家去东南亚旅行,我每天的预算在 200~500 美元之间,需要 3~6 个床位,目的地是 Thailand 和 Malaysia,去哪更划算呢?帮我画个图比较下性价比哈。

TableAgent 应答结果

TableAgent 针对本次会话耗时 40.8 秒,使用模型alaya 请求消耗 3846 个 Token, 响应消耗 2734 个 Token,共计 6580 个。

回答的结果非常详细,相当满意。

从数据中我们可以看出,Thailand 的平均价格为 255 美元,平均评分为 4.895,而 Malaysia 的平均价格为 315.667 美元,平均评分为 4.97333。这可能意味着在 Thailand 的价格相对较低,但评分相对较高,而 Malaysia 的价格相对较高,但评分也相对较高。

然而,这只是平均值,具体的房源价格和评分可能会因为房源的具体情况(如房源类型、设施、位置等)而有所不同。因此,如果您对价格和评分有特定的要求,建议您在选择房源时,不仅考虑价格和评分,还考虑其他因素,如房源类型、设施、位置等。

总的来说,如果您对价格和评分都有较高的要求,Thailand 可能是一个更好的选择,但如果您对其他因素也有较高的要求,Malaysia 可能是一个更好的选择。

贴切的服务

在问答结束,TableAgent 还基于当前问题提出了接下来可能感兴趣的问题。这样就可以当用户更加方便快捷的获取到自己想要的信息。

TableAgent 提供了 3 个备用问题,分别是:

  1. 哪些房源的折扣价格较低但评价较高,我可以尝试预订这些房源吗?
  2. 哪种类型的房源的价格更稳定,可以帮助我更好的控制预算?
  3. 哪种床型拥有最多的评价?

推荐问题提问

我们选择其中一个问题,接着进行提问。

在详情中列出了详细的流程以及代码,核心内容如下:

Alaya:

  • 计算每种类型房源的价格变动: 首先,从 df 中提取 Price(in dollar)Offer price(in dollar) 两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据 Title 列进行分组,计算每种类型的价格变动的平均值

  • 价格变动最小的房源类型: 从 df_price_diff 中找出 Price_Diff 列最小的行,取出对应的 Title 列的值

    首先,从df中提取'Price(in dollar)'和'Offer price(in dollar)'两列,然后计算两者的差值的绝对值,得到价格变动。然后,根据'Title'列进行分组,计算每种类型的价格变动的平均值

    df['Price_Diff'] = abs(df['Price(in dollar)'] - df['Offer price(in dollar)'])
    df_price_diff = df.groupby('Title')['Price_Diff'].mean().reset_index()

    从df_price_diff中找出'Price_Diff'列最小的行,取出对应的'Title'列的值

    min_price_diff_title = df_price_diff.loc[df_price_diff['Price_Diff'].idxmin(), 'Title']

根据数据分析,价格变动最小的房源类型是"{min_price_diff_title}"。这意味着这种类型的房源的价格相对稳定,你可以更容易地根据自己的预算来控制预算。

实战数据集分析二

第二个数据分析,我们选择的方向是"全球大城市人口 2022-2023",分析人口增长最高是哪个城市?并且对增长率最高的前10名进行画图展示。信息如下图:

分析结果

根据我们的数据分析,人口增长率最高的城市是Lokoja,来自尼日利亚,人口增长率为6.11%。其次是Bujumbura,来自 Burundi,人口增长率为5.93%。第三是Xiongan,来自中国,人口增长率为5.85%。

以下是这些城市的人口增长率的条形图,可以更直观地看到各城市的人口增长情况:

从这些数据中,我们可以看出,尼日利亚的 Lokoja 市的人口增长率最高,达到了 6.11%,其次是 Burundi 的 Bujumbura 市和中国的 Xiongan 市,两人的人口增长率分别为 5.93% 和 5.85%。这四个城市的人口增长率都非常高,这可能意味着这些城市的人口正在快速增长。

然而,值得注意的是,这些数据只是基于当前的数据进行的分析,实际的人口增长可能会受到许多因素的影响,例如经济状况、政策调整等。因此,这些数据只能作为参考,不能完全决定一个城市的人口走势。

分析哪个城市的未来人口最多

根据我们的数据分析,人口增长最快的城市是Delhi。

我们通过计算每个城市的人口增长来得出这个结果。这是基于当前的人口和增长率。具体的数据如下:

City Pop2023 growthRate
0 Tokyo -78107.6184 -0.0021
1 Delhi 899297.7084 0.0273
2 Shanghai 709822.6344 0.0243
3 Dhaka 754312.5200 0.0325
4 Sao Paulo 192267.7560 0.0085
5 Mexico City 198304.8338
6 Cairo 441445.6800 0.0199
7 Beijing 441854.1442 0.0203
8 Mumbai 340744.2560 0.0160
9 Osaka -45632.2416 -0.0024

这个表格显示了每个城市的预计 2023 年人口。你可以看到,Delhi 的预计人口增长率最高,这意味着这个城市的人口将在未来几年中迅速增长。

请注意,这个预测是基于当前的人口和增长率,并且可能会有所变动。因为人口增长受到许多因素的影响,包括但不限于经济状况、政策、自然灾害等。因此,这个结果应被视为一种可能的预测,而不是绝对的确定。

总结

TableAgent,由九章云极 DataCanvas 自主研发,为企业提供私有化部署,安全高效。以代码生成为基础,让每个人都能成为高级数据分析师,轻松应对描述性、诊断性和预测性分析。其专业化微调和 T+ 系统满足不同行业的独特需求。

通过实战数据集分析,展示了 TableAgent 强大的数据分析能力。从 Airbnb 民宿价格比较到全球大城市人口增长,TableAgent 提供了直观详细的结果。用户友好的界面、方便的上传功能以及贴切的推荐问题服务使其在数据分析领域脱颖而出。

总体而言,TableAgent 是数字化时代数据分析的得力助手,将复杂的数据分析变得简单易行。

相关推荐
真真-真真19 分钟前
WebXR
linux·运维·服务器
轩辰~42 分钟前
网络协议入门
linux·服务器·开发语言·网络·arm开发·c++·网络协议
wanhengidc1 小时前
短视频运营行业该如何选择服务器?
运维·服务器
赵钰老师1 小时前
【R语言遥感技术】“R+遥感”的水环境综合评价方法
开发语言·数据分析·r语言
s_yellowfish2 小时前
Linux服务器pm2 运行chatgpt-on-wechat,搭建微信群ai机器人
linux·服务器·chatgpt
vvw&2 小时前
如何在 Ubuntu 22.04 上安装 Ansible 教程
linux·运维·服务器·ubuntu·开源·ansible·devops
我一定会有钱2 小时前
【linux】NFS实验
linux·服务器
王铁柱子哟-2 小时前
解决 正在下载VS Code 服务器... 问题
运维·服务器
Ven%2 小时前
如何在防火墙上指定ip访问服务器上任何端口呢
linux·服务器·网络·深度学习·tcp/ip
泰伦闲鱼2 小时前
nestjs:GET REQUEST 缓存问题
服务器·前端·缓存·node.js·nestjs