告别excel:AI 驱动的数据分析指南

数据在职场中处处可见,比如汇报、写简历、做决策,就是简单的发放一个问卷调研,也要从调研结果有所洞察。可以说数据分析是打工人的必备技能了。

我在刚入职场的时候,不懂数据分析,不知道这玩意是干啥用的,感觉离自己很远。后来当了产品,要做决策,要规划下个版本,下半年做什么?为了让决策更科学,就要主动去收集信息。

比如产品的运营、销售情况、用户的需求反馈、用户行为数据等等,通常是自己来定义想要的指标,去企业内部的业务系统,或找相关业务的运营或开发拿到数据,在excel内制作图表。必要时还要设计的美观的可视化看板做汇报。

如果有经历过,就知道这个过程相当的消磨时间,特别是在excel里处理上千条内容,确定指标,绘制可视化图表,有时候一做就是一整天。

通常数据分析会涉及到的流程是:

1.数据收集与整合 :从各种来源收集原始数据,并将其整合到一个统一的数据集中

2.数据预处理与清洗 :处理缺失值、异常值,确保数据的质量和一致性

3.数据分析与挖掘 :设定指标、分析维度,挖掘数据中的规律和趋势

4.数据可视化与呈现 :通过图表和报告将分析结果转化为直观易懂的形式

这个流程对标准的数据分析产品和非标准的业务分析都同样适用,每一步都必不可少。虽然过程复杂耗时,但我们现在有了更好的解决方案。

对于上述四个步骤中,数据预处理、分析挖掘和可视化呈现都可以交给AI完成。比如下面效果👇

都是在获取到要分析的内容,结合数据分析看板生成提示词。

提示词1:数据预处理与清洗 发送要清洗的数据文件,或内容,让AI输出excel,甚至你不知道要清洗哪些字段,也可以告诉AI让他自己选择清洗。

复制代码
我需要对以下数据进行清洗和预处理。请帮我分析这些数据,识别需要清洗的问题(如缺失值、异常值、重复项、格式不一致等),并进行相应的清洗处理。请执行以下任务:
1. 分析数据结构和字段类型
2. 识别并处理缺失值
3. 检测并处理异常值和离群点
4. 移除重复记录
5. 标准化和规范化数据格式
6. 根据数据特点,自行判断并执行其他必要的清洗步骤

请以表格形式展示清洗前后的数据对比,并解释您采取的每一步清洗措施及其原因。如果有多个清洗步骤,请分别展示每个步骤的结果。

提示词2:数据分析与挖掘

发送excel、或文本内容,让AI列出可以分析的指标、分析维度,以及可以制作的图表,然后选择合适的指标、维度进行制作

复制代码
我需要对以下数据进行全面的分析与挖掘。请帮我分析这些数据,提供可行的分析方向和可视化建议。

请执行以下任务:
## 第一阶段:数据概览与分析可能性
1. 分析数据结构、字段类型和基本统计特征
2. 列出所有可能的分析指标(如总和、平均值、增长率、占比等)
3. 提供可行的分析维度(如时间维度、地域维度、产品维度、客户维度等)
4. 建议适合这些数据的图表类型(如折线图、柱状图、饼图、热力图、散点图等)

## 第二阶段:具体分析执行
基于上述分析,请选择最有价值的3-5个分析方向,并为每个方向:
1. 计算相关指标
2. 按照合适的维度进行分组或筛选
3. 创建对应的数据可视化图表
4. 提供对分析结果的解读和洞察

## 第三阶段:总结与建议
1. 总结数据中发现的主要趋势和模式
2. 提出基于数据分析的行动建议或决策支持
3. 指出可能需要进一步分析的方向

提示词3:数据可视化与呈现:

在获取到要分析的内容后,结合下面提示词,发送文本/Excel/PDF给大模型,就可以获取到数据分析看板

强大的代码生成能力,可制作HTMl代码,制作可交互的数据看板

复制代码
# HTML数据看板生成器

## 核心任务:
请分析我提供的数据源 (\[文本/Excel/PDF] - 请指明文件类型并简述内容),提取关键洞察和量化数据。构建一个单一、自包含的HTML文件,以专业、交互友好且视觉吸引人的数据看板形式展示这些信息。

## 关键要求:
1.  数据处理与转换:
    * 清晰阐述将原始输入数据转换为适用于可视化的结构化 JavaScript 对象/数组的逻辑。
    * 选择3-5个核心指标,使用适合数据类型的图表(折线图、柱状图、饼图等)
    * 仔细阅读内容,找出可量化的数据、关键趋势、公司案例或观点。

2.  可视化与交互性 (ECharts 核心):
    * 主要库: 使用 ECharts 5.x 进行所有图表绘制。
    * 图表选型: 采用最能代表数据特性和洞察的 ECharts 图表类型(如折线图、柱状图、饼图/环形图、散点图、热力图等)。
    * 图表精细化: 图表必须精细调整,包含清晰的标题、坐标轴、标签、内容丰富的提示框 (Tooltip) 和可交互的图例 (Legend)。为数据密集的图表实现 `dataZoom`(区域缩放)。包含 `toolbox`(工具栏)以支持常用操作(保存图片、数据视图)。
    * 目的性交互: 除默认交互外,考虑简单的筛选器、动态排序(若看板中包含表格数据)或图表联动 (ECharts `connect`) 是否能显著增强数据探索性,并在单文件上下文中可行时实现。

3.  代码结构与技术 (单一HTML文件):
    * HTML: 语义化的 HTML5 结构。为不同的看板区域(如KPI、主图表、详细分解)和图表元素使用明确的 `div` 容器。
    * CSS:
        * 在 `<style>` 标签内嵌入 CSS,或少量使用内联样式。
        * 采用功能优先的CSS方法论(例如,用于边距、内边距、Flexbox/Grid布局、排版),以实现简洁、可维护且响应式的设计,避免外部框架依赖。
    * JavaScript:
        * 模块化: 将 JavaScript 分解为定义良好的函数(例如 `processData()`、`createChart1Options()`、`renderChart1()`、`updateDashboardSection()`)。以此模拟组件化方式,提升代码清晰度。
        * 数据流: 清晰定义数据从处理到图表配置项及渲染的流程。
        * 动态内容: 如果能简化结构,使用 JavaScript 动态生成重复性元素(如信息卡片或列表项)的 HTML。
        * 事件处理: 确保 ECharts 实例在 `window.resize` 时能正确 `resize()` (考虑防抖优化性能)。

4.  设计与用户体验:
    * 主题与风格: \[建议一个:现代简约风、科技暗黑模式、商务专业风,或根据数据内容选择]。
    * 布局: 简洁、响应式,确保在不同设备(桌面、平板、移动端)上的可读性。关键信息应突出显示。
    * 色板: 使用专业且易于访问的调色板。如果涉及品牌颜色,\[请提供HEX色值]。

## 期望输出:
一个单一、完整的HTML文件,并且:
* 能在现代浏览器中无错直接运行。
* 完全响应式且视觉效果优良。
* 有效运用 ECharts 进行富有洞察力的数据可视化和交互。
* 包含结构良好且有注释的 HTML、CSS 和 JavaScript 代码。

如果你不会写提示词,还可以用PromptIDE-提示词开发工具帮你写提示词,以自动补全SQL为例。

假设我们有一个订单明细表(t_order_detail)包含order_id(订单id)、goods_id(商品id)、dept_id(门店id)、num(销量)、price(单价)、order_time(销售时间),我们需要某时间段内贡献门店80%销售额的商品。

生成的提示词如下:

复制代码
# 角色: 
SQL查询专家

## 背景: 
用户需要根据提供的字段及需求编写SQL查询语句。这可能是因为用户需要从数据库中提取特定数据以支持业务决策、生成报告或进行数据分析。用户可能对SQL语法不熟悉,或者需要优化现有的查询语句。

## 注意:
1、用户希望通过SQL查询快速获取所需数据,因此查询语句需要高效且准确。
2、用户可能对数据库结构不熟悉,因此需要清晰的字段描述和表关系说明。
3、用户可能希望查询语句能够灵活应对不同的数据需求,因此需要具备一定的通用性和可扩展性。

## 技能:
1、精通SQL语法,能够编写复杂的查询语句。
2、熟悉数据库结构设计,能够理解表之间的关系。
3、具备优化查询性能的能力,能够编写高效的SQL语句。
4、能够根据业务需求设计查询逻辑,确保查询结果符合业务要求。

## 目标:
1、根据用户提供的字段及需求,编写准确的SQL查询语句。
2、确保查询语句能够高效执行,避免性能瓶颈。
3、提供查询语句的解释,帮助用户理解查询逻辑。
4、根据用户反馈,优化查询语句以满足不断变化的需求。

## 约束:
1、查询语句必须符合SQL语法规范。
2、查询语句必须基于用户提供的字段和表结构。
3、查询语句应尽量避免复杂的嵌套查询,以提高可读性和执行效率。
4、查询语句应考虑到数据库的性能,避免全表扫描等低效操作。

## 输入:
<字段描述>请补充需要查询的字段名称及其描述</字段描述>

<表结构>请补充相关表的名称及其字段结构</表结构>

<查询需求>请补充具体的查询需求</查询需求>

## 输出:
1、生成的SQL查询语句。
2、查询语句的解释,包括查询逻辑和字段说明。
3、查询语句的性能优化建议(如有必要)。
4、针对用户需求的进一步建议或扩展查询示例。

## 工作流:
1、分析用户提供的字段描述,明确需要查询的字段。
2、分析用户提供的表结构描述,理解表之间的关系。
3、根据用户提供的查询需求描述,设计查询逻辑。
4、编写SQL查询语句,并确保其符合语法规范和性能要求。
5、提供查询语句的解释和优化建议,帮助用户理解和使用查询结果。

接下来我们把我们的需求补充完整后发给大模型:

生成的数据如下

复制代码
WITH SalesData AS (
    SELECT 
        dept_id AS 门店,
        goods_id AS 商品,
        SUM(num * price) AS 累计销售额,
        ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY SUM(num * price) DESC) AS 排名
    FROM 
        t_order_detail
    WHERE 
        order_time >= '2025-02-01' AND order_time < '2025-03-01'
    GROUP BY 
        dept_id, goods_id
)
SELECT 
    门店,
    商品,
    累计销售额,
    排名
FROM 
    SalesData
WHERE 
    累计销售额 >= (SELECT PERCENTILE_CONT(0.8) WITHIN GROUP (ORDER BY 累计销售额) FROM SalesData AS sd WHERE sd.门店 = SalesData.门店)
ORDER BY 
    门店 DESC, 商品 DESC;

除此之外,我们还可以用数据工坊一键生成数据分析报告。

举个例子:我们有一份销售数据,需要输出一份数据分析报告。只需要短短几步就可以完成。

上传数据,生成数据分析维度。

精调维度,生成数据分析报告。

短短几分钟,AI 不仅能够快速生成漂亮、有效的数据可视化图表,还能通过人工智能算法,提供更有价值的数据洞察,比如识别数据中的异常模式、相关性和趋势等。让数据可视化不再只是展示,而是洞察的催化剂。

同样对于生成的数据分析报告中的文字和图表还是可以进行精调。

数据分析师而言,AI 时代的到来同样蕴藏着巨大的发展红利。

那些率先理解 AI、掌握 AI、并能将其成功应用于实际工作中的人,将成为行业的佼佼者。

让我们与AI共同进步。

附:AI工具链接

提示词开发工具|巨人肩膀

数据工坊|巨人肩膀

相关推荐
yzx9910134 分钟前
Python开发功能项目
服务器·开发语言·人工智能·python·深度学习
测试者家园11 分钟前
接口测试不再难:智能体自动生成 Postman 集合
软件测试·人工智能·测试工具·postman·agent·智能化测试·测试开发和测试
tonydf12 分钟前
浅尝一下微软的AutoGen框架
人工智能·后端
redreamSo13 分钟前
AI Daily | AI日报:Alexandr Wang加盟Meta,AI竞赛风云突变; Meta推V-JEPA 2,小扎抢人才; SwitchBot:国产AI破日本市场
程序员·aigc·资讯
柠檬味拥抱17 分钟前
面向大语言模型的MCP插件系统架构与能力协商机制研究
人工智能
Blossom.11835 分钟前
基于深度学习的异常检测系统:原理、实现与应用
人工智能·深度学习·神经网络·目标检测·机器学习·scikit-learn·sklearn
VR最前沿43 分钟前
Xsens动捕和Manus数据手套在元宇宙数字人制作中提供解决方案
大数据·人工智能·科技·机器人·自动化
好好学习啊天天向上1 小时前
深度学习编译器
人工智能·深度学习
Gyoku Mint1 小时前
机器学习×第七卷:正则化与过拟合——她开始学会收敛,不再贴得太满
人工智能·python·算法·chatgpt·线性回归·ai编程
说私域1 小时前
新零售视域下实体与虚拟店融合的技术逻辑与商业模式创新——基于开源AI智能名片与链动2+1模式的S2B2C生态构建
人工智能·小程序·开源·零售