
💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主
📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node...
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析
文章目录
- 🚀前言
- [🚀一、Excel/WPS 表格自动化处理](#🚀一、Excel/WPS 表格自动化处理)
-
- 🔎1.数据分析的价值与挑战
- [🔎2.案例一:WPS 表格销售数据分析](#🔎2.案例一:WPS 表格销售数据分析)
-
- [🦋1. 场景设定](#🦋1. 场景设定)
- [🦋2. 传统做法的问题](#🦋2. 传统做法的问题)
- [🦋3. OpenClaw 自动化方案](#🦋3. OpenClaw 自动化方案)
- [🦋4. WPS 表格的特殊处理](#🦋4. WPS 表格的特殊处理)
- [🦋5. 实际效果展示](#🦋5. 实际效果展示)
- [🦋6. 常见问题排查](#🦋6. 常见问题排查)
- [🔎3.案例二:Excel 财务数据分析](#🔎3.案例二:Excel 财务数据分析)
-
- [🦋1. 场景设定](#🦋1. 场景设定)
- [🦋2. 财务分析的特殊性](#🦋2. 财务分析的特殊性)
- [🦋3. OpenClaw 自动化方案](#🦋3. OpenClaw 自动化方案)
- [🦋4. 实际效果展示](#🦋4. 实际效果展示)
- [🦋5. Excel 与 WPS Excel 的选择建议](#🦋5. Excel 与 WPS Excel 的选择建议)
- 🔎4.数据清洗四步法
- 🔎5.数据透视分析
-
- [🦋1. 常用维度](#🦋1. 常用维度)
- [🦋2. 透视分析的 Skill 调用](#🦋2. 透视分析的 Skill 调用)
- [🦋3. 透视表配置示例](#🦋3. 透视表配置示例)
- 🔎6.数据可视化实现方法
-
- 🦋原则一:选对图表类型
- 🦋原则二:简化视觉元素
- 🦋原则三:突出重点信息
- 🦋原则四:保持一致性
- 🦋原则五:考虑色觉障碍
- [🦋可视化 Skill 调用](#🦋可视化 Skill 调用)
- 🔎附:AI提示词模板与完整回答示例
-
- 🦋提示词模板(用户在飞书中@数字员工输入)
- [🦋AI Agent(数字员工)的完整回答(飞书消息)](#🦋AI Agent(数字员工)的完整回答(飞书消息))
🚀前言
你有没有这样的经历?
周五下午五点,老板给你发过来 句话:"下周 早会,把上季度的销售数据整理一下,做个PPT 给我"你看着计算机里乱L 八槽的Excel 表格、心 里默默算了一笔账------清洗数据两小时、做透视表一小时,做图表一小时,写 PPT三小时,再改三版......这个周末、又没了
这不是你一个人的困境。根据麦肯锡2023年的一项调研、知识工作者平 均每周要花11个小时在数据整理和报告制作1注意,是"整理"和"制作", 不是"分析"和"决策"。也就是说,我们花了大量时间在做"体力活"、而不 是"脑力活"
更让人难受的是,这些体力活往往技术含量不高,但容错率极低。一个数 字错了,整个报告的可信度就崩塌了;一个图表配色不合适,老板会觉得你态 度有问题。我们像是在走钢丝、战战兢兢,如履薄冰。
但问题是,这些工作真的需要人来干吗?
本系列要解决的就是这个核心问题。你将学会如何用OpenClaw 让数字员工 替你完成从数据清洗到报告生成的全流程。具体来说,我们会覆盖两大方面:
-
第 一 :Excel/WPS表格自动化处理------让AI 帮你清洗数据、做透视分析、生成可视化图表。
-
第 二 :PPT 智能生成工作流------从大纲撰写到页面设计,从图表嵌入到排 版美化,全程自动化。
学完这系列,你将拥有一套完整的"数据 → 洞察 → 展示"自动化工作流。 下次老板再发任务过来,你可以淡定地回一句:"好的,10分钟后发您。"
这不是吹牛,这是技术赋予我们的底气。
🚀一、Excel/WPS 表格自动化处理
Excel 是职场人的"第二语言",但说实话,这门语言学起来并不轻松。VLOOKUP、数据透视表、条件格式、宏......每一个功能背后都是一摞教程和无数个加班的夜晚。
更麻烦的是,Excel 和 WPS 表格虽然看起来差不多,但二者的底层逻辑有不少差异。很多在 Excel 里能用的公式,放到 WPS 表格里就会报错;而 WPS 表格的很多智能功能,Excel 又不支持。这就导致我们在学习时经常踩坑,在实际使用时也经常抓狂。
这一节将用两个完整的案例演示如何用 OpenClaw 打通 Excel 和 WPS 表格的自动化处理。你会发现,原来那些让你头疼的操作,现在只需要一句话就能搞定。
🔎1.数据分析的价值与挑战
在讲具体操作之前,我们先来聊聊数据分析的价值。很多人以为数据分析就是"把数字整理得好看一点",这个理解太浅了。数据分析的真正价值,是帮你从混沌中找出规律,从噪声中提取信号,根据过去预测未来。
举个例子。你是一家电商公司的运营人员,手里有一份销售数据表,包含"订单时间""商品品类""销售金额""客户地区"等字段。如果你只是把销售数据加起来,算出"总销售额",这叫统计,不叫分析。
真正的分析是:哪个时间段的转化率最高?哪个品类的复购率最高?哪个地区的客单价最高?这些问题的答案,才能指导你的决策。
但问题是,从原始数据到洞察结论,中间隔着四座"大山"(如图4-1所示):
- 第一座"大山":数据清洗。原始数据往往是脏的------有空值、有重复值、有异常值、有格式不统一。你要先花大量时间把这些"杂质"去掉,才能开始分析。
- 第二座"大山":数据处理。清洗完之后,你要做各种计算、筛选、排序、分组、聚合。这些操作并不难,但步骤多、容易错,而且每次数据更新都要重新做一遍。
- 第三座"大山":可视化呈现。数据算出来了,还要做成图表。图表类型怎么选?配色怎么配?标签怎么放?这些细节决定了你的报告是"专业"还是"业余"。
- 第四座"大山":洞察提炼 。这是最难的一步。数字本身不会说话,你要从数据中提炼出结论,并用通俗的语言解释给非专业人士听。

传统的工作方式下,这四座"大山"都要靠人一步一步爬。但有了 OpenClaw 后,我们可以让数字员工替我们爬前三座"大山",我们只需要专注于最后一座"大山"------洞察提炼。
这才是人机协作的正确方式:AI 负责体力活,人负责脑力活。
🔎2.案例一:WPS 表格销售数据分析
我们先来看第一个案例:用 WPS 表格做销售数据分析。
🦋1. 场景设定
假设你是某家电品牌的区域销售经理,手里有一份2024年上半年的销售数据表,这张表包含的字段见表4-1。
表4-1 销售数据表
| 字段名 | 说明 | 数据类型 | 示例 |
|---|---|---|---|
| 订单日期 | 交易发生的日期 | 日期 | 2024-01-15 |
| 销售区域 | 华东、华南、华北、西南等 | 文本 | 华东 |
| 产品品类 | 空调、冰箱、洗衣机、电视等 | 文本 | 空调 |
| 销售金额 | 订单金额(元) | 数值 | 8999 |
| 销售数量 | 销售台数 | 数值 | 2 |
| 销售人员 | 负责该订单的销售人员 | 文本 | 张三 |
| 客户类型 | 新客户/老客户 | 文本 | 新客户 |
| 订单状态 | 已完成/退款中/已取消 | 文本 | 已完成 |
你的任务是:分析各区域、各品类的销售表现,找出增长机会,并生成可视化图表。
🦋2. 传统做法的问题
按照传统做法,你需要:
- 打开 WPS 表格,检查数据是否有空值、异常值(约30分钟)
- 用数据透视表做区域汇总、品类汇总(约30分钟)
- 计算同比增长率、环比增长率(约30分钟)
- 制作柱状图、饼图、折线图(约45分钟)
- 调整图表样式、配色、标签(约30分钟)
这一套下来,熟练工也要 2~3小时。如果数据更新了,还要重新来一遍。
🦋3. OpenClaw 自动化方案
现在,我们用 OpenClaw 来搞定这一切。
(1)准备数据文件
把你的销售数据保存为 WPS 表格文件,命名为"2024上半年销售数据.xlsx"。确保数据在第一张工作表中,第一行是表头。数据格式检查清单:
- ✅ 第一行是表头,没有合并单元格
- ✅ 日期格式统一(建议使用 YYYY-MM-DD 格式)
- ✅ 数值列没有文本格式的数字
- ✅ 没有多余的空行或空列
- ✅ 文件保存为 .xlsx 格式(不是 .xls)
(2)调用 OpenClaw 数据清洗 Skill
在 OpenClaw 中,使用以下指令:
请帮我分析这个销售数据文件:/path/to/2024上半年销售数据.xlsx
需要完成以下任务:
1. 数据清洗:检查并处理空值、异常值、重复数据。
2. 生成透视分析:按销售区域、产品品类、月份三个维度汇总销售额和销售量。
3. 计算关键指标:区域销售对比、品类销售占比、月度销售趋势。
4. 生成可视化图表:区域销售对比柱状图、品类销售占比饼图、月度销售趋势折线图。
5. 输出洞察:找出销售表现最好的区域和品类,指出增长机会。
如果你想要更精细的控制,可以调用 OpenClaw 的高级 Skill:
python
# OpenClaw Skill 调用示例:销售数据分析
skill_name = "excel_sales_analysis"
parameters = {
"file_path": "/path/to/2024上半年销售数据.xlsx",
"sheet_name": "Sheet1",
"data_cleaning": {
"handle_null": "drop", # 选项:drop/fill/marker
"null_fill_method": "median", # 当 handle_null 为 fill 时生效
"remove_duplicates": True,
"outlier_detection": "iqr", # 选项:iqr/3sigma/none
"outlier_threshold": 1.5
},
"pivot_analysis": {
"dimensions": ["销售区域", "产品品类", "月份"],
"metrics": {
"销售金额": "sum",
"销售数量": "sum"
},
"calculations": {
"region_share": True,
"category_share": True,
"monthly_trend": True,
"yoy_growth": True,
"mom_growth": True
}
},
"visualization": {
"charts": [
{
"type": "bar",
"title": "区域销售对比",
"x": "销售区域",
"y": "销售金额",
"highlight_max": True
},
{
"type": "pie",
"title": "品类销售占比",
"category": "产品品类",
"value": "销售金额",
"show_top_n": 5
},
{
"type": "line",
"title": "月度销售趋势",
"x": "月份",
"y": "销售金额",
"show_points": True
}
],
"color_scheme": "business_blue",
"output_format": "png",
"resolution": 300
},
"insights": {
"generate_summary": True,
"identify_opportunities": True,
"anomaly_detection": True
},
"output": {
"cleaned_data": "销售数据_清洗后.xlsx",
"pivot_tables": "销售数据_透视分析.xlsx",
"charts_folder": "./charts/",
"report": "销售数据分析报告.md"
}
}
(3)查看分析结果
OpenClaw 会自动完成以下操作:
- 数据清洗:识别出空值、重复记录、异常值,并给出处理建议。
- 透视分析:生成三个维度的汇总表,保存为新的工作表。
- 可视化图表:生成三张图表,保存为 PNG 文件。
- 洞察报告:输出一段文字分析。
整个过程大约需要 30秒到1分钟,具体取决于数据量大小。
(4)人工复核与调整
AI 生成的结果不是100%完美的,还需要人工复核:
- 检查数据清洗的逻辑是否合理(比如异常值是否真的异常)
- 确认透视分析的维度是否符合你的需求
- 调整图表的配色、字体、标签位置
- 补充 AI 没有发现的洞察
复核时间为 10~15分钟 。相比传统做法的2~3小时,效率提升了 10倍以上。
🦋4. WPS 表格的特殊处理
WPS 表格和 Excel 在公式语法上基本一致,但有一些细节差异需要注意:
- 智能填充功能:WPS 表格的智能填充功能(Ctrl+E)比 Excel 更强大,可以自动识别填充规律。OpenClaw 会优先使用这个功能。
- 云文档同步:如果你的文件保存在 WPS 云文档中,OpenClaw 可以直接读取和写入,无须上传本地文件。
- 中文函数名:WPS 表格支持中文函数名(比如用"求和"代替"SUM"),但 OpenClaw 默认使用英文函数名以保证兼容性。
🦋5. 实际效果展示
原始数据有5000行,经过 OpenClaw 处理后,得到:
- 清洗后的数据表(4992行,去除了8行脏数据)
- 区域汇总表(6个区域的销售数据)
- 品类汇总表(8个品类的销售数据)
- 月度汇总表(6个月的销售趋势)
- 区域品类交叉分析表
- 三张可视化图表(柱状图、饼图、折线图)
- 一份800字左右的洞察报告
整个过程,你只需要说一句话,然后花10分钟复核。
🦋6. 常见问题排查
在使用 OpenClaw 处理 WPS 表格数据时,可能会遇到多种问题,具体见表4-2。
表4-2 常见问题排查
| 问题 | 可能原因 | 解决方案 |
|---|---|---|
| 文件读取失败 | 文件被占用或损坏 | 关闭WPS后重试,或另存为新文件 |
| 日期格式错误 | 日期列包含文本 | 使用OpenClaw的日期格式化功能 |
| 透视表生成失败 | 数据区域包含空行 | 删除空行或指定数据范围 |
| 图表中文乱码 | 字体缺失 | 指定使用系统自带字体 |
| 计算结果不对 | 数值列是文本格式 | 先转换为数值格式再计算 |
这就是数字员工的价值:不是取代你,而是让你把时间和精力花在真正重要的事情上。
🔎3.案例二:Excel 财务数据分析
第二个案例,我们来看如何用 Excel 做财务数据分析。这个案例使用与第一个案例不同的数据,侧重点也不同。
🦋1. 场景设定
假设你是某公司的财务分析师,手里有一份2024年1---6月的财务数据表,包含以下字段(见表4-3)。
表4-3 财务数据表
| 字段名 | 说明 | 数据类型 | 示例 |
|---|---|---|---|
| 日期 | 记账日期 | 日期 | 2024-01-15 |
| 科目 | 收入/成本/费用科目 | 文本 | 销售收入 |
| 科目类型 | 收入/成本/费用 | 文本 | 收入 |
| 部门 | 所属部门 | 文本 | 销售部 |
| 金额 | 发生金额 | 数值 | 100000 |
| 借贷方向 | 借/贷 | 文本 | 贷 |
| 项目 | 关联项目 | 文本 | 项目A |
| 备注 | 说明信息 | 文本 | 1月销售收入 |
你的任务是:生成月度损益表、部门费用分析、项目盈亏分析,并找出成本控制的机会点。
🦋2. 财务分析的特殊性
财务分析和销售分析有几个重要区别:
- 准确性要求更高:财务数据关系到报表合规,一个小数点都不能错。
- 逻辑关系更复杂:收入-成本=毛利,毛利-费用=净利,这些勾稽关系必须正确。
- 时间维度更重要:月度、季度、年度的对比分析是标配。
- 合规性要求:某些分析需要符合会计准则或内部审计要求。
这些特点决定了财务分析不能完全"黑箱化",你必须理解 AI 的每一步操作,并能解释给审计人员听。
🦋3. OpenClaw 自动化方案
(1)准备数据文件
把财务数据保存为 Excel 文件,命名为"2024上半年财务数据.xlsx"。建议按月份分工作表,或者添加"月份"字段。财务数据准备清单:
- 科目分类准确(收入/成本/费用)
- 借贷方向正确
- 金额单位统一(元/万元)
- 部门归属清晰
- 项目关联完整
(2)调用 OpenClaw 财务分析 Skill
在 OpenClaw 中,使用以下指令:
请帮我分析这个财务数据文件:/path/to/2024上半年财务数据.xlsx
需要完成以下任务:
1. 数据验证:检查借贷平衡、科目完整性、金额合理性。
2. 生成损益表:按月份汇总收入、成本、费用,计算毛利和净利。
3. 部门费用分析:按部门汇总各项费用,计算费用率。
4. 项目盈亏分析:按项目汇总收入和成本,计算项目利润。
5. 趋势分析:对比各月数据,找出异常波动。
6. 成本控制建议:基于分析结果,指出成本控制的机会点。
详细的财务分析 Skill 调用指令如下:
python
# OpenClaw Skill 调用示例:财务数据分析
skill_name = "excel_financial_analysis"
parameters = {
"file_path": "/path/to/2024上半年财务数据.xlsx",
"validation": {
"check_balance": True, # 检查借贷平衡
"check_completeness": True, # 检查科目完整性
"check_reasonableness": True, # 检查金额合理性
"anomaly_threshold": 3.0 # 异常值阈值(倍)
},
"reports": {
"income_statement": {
"period": "monthly", # 月度损益表
"structure": [
"营业收入",
"营业成本",
"毛利",
"销售费用",
"管理费用",
"财务费用",
"营业利润",
"净利润"
]
},
"department_analysis": {
"group_by": "部门",
"metrics": ["费用总额", "费用率", "同比变化"]
},
"project_analysis": {
"group_by": "项目",
"metrics": ["收入", "成本", "利润", "利润率"]
}
},
"calculations": {
"gross_margin": True, # 毛利率
"net_margin": True, # 净利率
"expense_ratio": True, # 费用率
"yoy_comparison": True, # 同比
"mom_comparison": True # 环比
},
"output": {
"validation_report": "财务数据验证报告.xlsx",
"income_statement": "损益表.xlsx",
"department_analysis": "部门费用分析.xlsx",
"project_analysis": "项目盈亏分析.xlsx",
"charts": "./financial_charts/",
"insights": "财务分析洞察.md"
}
}
(3)理解 AI 的处理逻辑
OpenClaw 会首先进行数据验证:
- 检查所有金额是否为数字
- 检查是否有未分类的科目
- 计算月度借贷总额是否平衡
- 标记异常大额交易(超过月均值的3倍)
(4)人工复核重点
财务数据分析的复核要特别注意以下四点:
- 勾稽关系检查:收入-成本=毛利,毛利-费用=净利,这些等式必须成立。
- 异常交易核实:对于 AI 标记的异常交易,要逐一核实是否有合理解释。
- 科目归类确认:确保每一笔交易都归到了正确的科目。
- 比率计算逻辑:毛利率、净利率的计算公式要符合公司规定。
🦋4. 实际效果展示
假设你的财务数据有3000行,涉及10个部门、15个项目、50个科目。经过 OpenClaw 处理后,你会得到:
- 财务数据验证报告(指出5处数据问题)
- 月度损益表(6个月的数据)
- 部门费用分析表(10个部门的费用明细)
- 项目盈亏分析表(15个项目的利润情况)
- 趋势分析图表(收入、成本、费用的月度走势)
- 成本控制建议(5~8条具体建议)
整个分析过程,传统做法需要 4~6小时 ,OpenClaw 方案只需要 1小时(含复核)。
🦋5. Excel 与 WPS Excel 的选择建议
通过这两个案例,我们可以总结出 Excel 和 WPS Excel 的选择建议,见表4-4。
表4-4 Excel 与 WPS Excel 的选择建议
| 场景 | 推荐工具 | 理由 |
|---|---|---|
| 日常办公、轻量分析 | WPS Excel | 免费、云同步、模板丰富 |
| 复杂财务分析、宏编程 | Excel | 功能更强大、兼容性更好 |
| 团队协作、多人编辑 | WPS Excel | 云文档实时同步 |
| 与外部系统对接 | Excel | 企业级软件兼容性更好 |
| 数据量大(10万行以上) | Excel | 性能更稳定 |
| 需要高级图表功能 | Excel | 图表类型更丰富 |
| 预算有限 | WPS Excel | 个人版免费 |
| 需要VBA开发 | Excel | VBA功能更完善 |
OpenClaw 对两个工具都提供支持,你可以根据实际情况进行选择。
🔎4.数据清洗四步法
数据清洗是数据分析的第一步,也是最关键的一步。如果数据是脏数据,即使用再强大的算法也算不出好结果。OpenClaw 的数据清洗遵循 "四步法",这是一个通用方法,适用于各种数据场景。
🦋第一步:完整性检查
完整性检查的目的是找出缺失数据,并决定如何处理。
常见问题:
- 空值:某些单元格没有数据
- 不完整记录:某些行缺少关键字段
- 部分缺失:某些列的数据不完整
处理方法:
- 删除:如果缺失比例很小(<5%),可以直接删除
- 填充:用均值、中位数、众数填充,或用前后插值法填充数据
- 标记:保留原数据,新增一列以标记是否缺失
- 估算:基于其他字段估算缺失值
OpenClaw 会自动检测缺失情况,并给出处理建议。你可以根据数据特点选择合适的方法。
完整性检查的具体配置:
python
# OpenClaw 完整性检查配置
completeness_check = {
"columns_to_check": ["订单日期", "销售金额", "销售区域"], # 关键字段
"null_threshold": 0.05, # 缺失率阈值
"actions": {
"订单日期": "drop", # 日期缺失则删除整行
"销售金额": "fill_median", # 销售金额用中位数填充
"销售区域": "fill_mode", # 区域用众数填充
"销售人员": "marker" # 销售人员缺失则标记
}
}
🦋第二步:一致性检查
一致性检查的目的是找出格式不统一、标准不一致的数据。
常见问题:
- 日期格式不统一:有的是"2024-01-01",有的是"2024/1/1"
- 文本大小写不统一:有的是"北京",有的是"beijing"
- 单位不统一:有的是"元",有的是"万元"
- 分类标准不统一:有的是"华东",有的是"华东地区"
处理方法:
- 标准化:统一日期格式、文本大小写、单位
- 映射表:建立标准映射,比如"华东"→"华东地区"
- 正则表达式:用规则批量处理
OpenClaw 会识别出不一致的情况,并自动进行标准化处理。处理前会生成预览,让你确认是否正确。
一致性检查的具体配置:
python
# OpenClaw 一致性检查配置
consistency_check = {
"date_standardization": {
"input_formats": ["%Y-%m-%d", "%Y/%m/%d", "%d-%b-%Y"],
"output_format": "%Y-%m-%d"
},
"text_standardization": {
"case": "upper", # 统一为大写
"trim_whitespace": True, # 去除首尾空格
"remove_special_chars": True # 去除特殊字符
},
"mapping_tables": {
"销售区域": {
"华东区": "华东",
"华东地区": "华东",
"华南区": "华南",
"华南地区": "华南"
}
},
"unit_conversion": {
"销售金额": {
"from": "万元",
"to": "元",
"multiplier": 10000
}
}
}
🦋第三步:准确性检查
准确性检查的目的是找出异常值和错误数据。
常见问题:
- 异常值:明显偏离正常范围的数值
- 逻辑错误:比如年龄为负数、日期在未来
- 重复数据:完全相同的记录出现了多次
- 离群点:统计意义上的异常值
处理方法:
- 删除:确认是错误的数据,直接删除
- 修正:根据上下文修正错误
- 标记:保留但标记为异常
- 保留:如果是真实的极端情况,保留并备注
OpenClaw 会用统计方法(如3σ原则、IQR方法)识别异常值,并给出处理建议。你需要人工判断哪些是错误,哪些是真实的极端情况。
准确性检查的具体配置:
python
# OpenClaw 准确性检查配置
accuracy_check = {
"outlier_detection": {
"method": "iqr", # 或 "3sigma"
"columns": ["销售金额", "销售数量"],
"iqr_multiplier": 1.5,
"action": "flag" # flag/drop/correct
},
"logical_checks": {
"订单日期": {
"min": "2024-01-01",
"max": "2024-12-31"
},
"销售金额": {
"min": 0,
"max": 1000000
}
},
"duplicate_detection": {
"columns": ["订单日期", "销售区域", "产品品类", "销售金额"],
"action": "drop" # drop/flag
}
}
🦋第四步:有效性检查
有效性检查的目的是确保数据符合业务逻辑。
常见问题:
- 逻辑矛盾:比如"离职日期"早于"入职日期"
- 范围超限:比如"年龄"超过150岁
- 关联错误:比如引用了不存在的客户ID
- 业务规则违反:比如"订单金额"小于"商品单价"
处理方法:
- 规则校验:基于业务规则编写校验逻辑
- 关联检查:检查外键关联是否正确
- 人工复核:对可疑数据进行人工确认
OpenClaw 支持自定义校验规则,你可以根据业务需求编写规则脚本。
有效性检查的具体配置:
python
# OpenClaw 有效性检查配置
validity_check = {
"business_rules": [
{
"name": "订单金额检查",
"condition": "订单金额 >= 商品单价 * 数量",
"action": "flag"
},
{
"name": "日期逻辑检查",
"condition": "结束日期 >= 开始日期",
"action": "flag"
}
],
"reference_checks": {
"客户ID": {
"reference_table": "客户表",
"reference_column": "客户ID",
"action": "flag"
}
}
}
数据清洗的 Skill 调用:在 OpenClaw 中,你可以这样调用数据清洗功能:
请帮我清洗这个数据文件:/path/to/data.xlsx
清洗要求:
1. 完整性:检查空值,对销售金额列用中位数填充。
2. 一致性:统一日期格式为 YYYY-MM-DD,统一地区名称为标准名称。
3. 准确性:用3σ原则识别异常值,标记超过均值3倍的数据。
4. 有效性:检查订单金额是否大于0,检查日期是否在合理范围内。
输出清洗报告,说明每一步的处理结果。
OpenClaw 会生成详细的清洗报告,包括:
- 原始数据统计(行数、列数、缺失率)
- 每一步的处理结果(处理了多少数据、用了什么方法)
- 清洗后的数据统计
- 问题数据清单(需要人工复核的数据)
这个报告可以作为数据质量文档存档备查。
🔎5.数据透视分析
数据透视表是 Excel/WPS Excel 最强大的功能之一,但也是最容易被用错的功能。很多人做透视分析时,维度选得不对,导致结果要么太"粗"(看不出细节),要么太"细"(看不出规律)。本节总结了几个常用的透视分析维度,帮你快速找到分析的切入点。
🦋1. 常用维度
(1)时间维度
时间是最常用的分析维度,几乎所有数据都可以按时间分析。
常用时间维度:
- 年:年度对比、长期趋势
- 季度:季节性分析、季度目标
- 月:月度跟踪、预算执行
- 周:周度复盘、短期波动
- 日:日常监控、异常发现
- 时段:日内分析(比如早中晚、上下班)
时间维度要根据分析目的来定:
- 看长期趋势,用"年"或"季度"
- 看短期执行,用"月"或"周"
- 看日常运营,用"日"或"时段"
(2)空间维度
空间维度适合有地域属性的数据。
常用空间维度:
- 大区:华东、华南、华北等
- 省份:各省对比
- 城市:城市级分析
- 门店:门店级分析
- 渠道:线上、线下、分销等
空间维度的选择要考虑业务特点:
- 全国性业务,用"大区"或"省份"
- 区域性业务,用"城市"或"门店"
- 多渠道业务,用"渠道"
(3)产品维度
产品维度适合零售、制造等行业。
常用产品维度:
- 品类:大类对比(比如家电、数码、服装)
- 品牌:品牌对比
- SKU:单品分析
- 价格带:按价格区间分组
- 新品/老品:生命周期分析
产品维度的选择要考虑分析深度:
- 战略分析,用"品类"或"品牌"
- 战术分析,用"SKU"或"价格带"
- 运营分析,用"新品/老品"
(4)客户维度
客户维度适合有客户数据的企业。
常用客户维度:
- 客户类型:新客户/老客户
- 客户等级:VIP/普通/潜在
- 客户来源:自然流量/广告/推荐
- 客户价值:高价值/中价值/低价值
- 客户行为:活跃/沉默/流失
客户维度的选择要考虑营销目标:
- 获客分析,用"客户来源"
- 留存分析,用"客户类型"或"客户行为"
- 价值分析,用"客户等级"或"客户价值"
(5)组合维度
现实中,单一维度往往不够,需要组合多个维度进行综合分析。
常用组合维度:
- 时间+空间:各区域月度趋势
- 时间+产品:各品类季度变化
- 空间+产品:各区域品类结构
- 客户+产品:各客户类型的购买偏好
- 时间+客户:各客户类型的月度活跃度
组合维度的选择要遵循 MECE 原则(相互独立、完全穷尽),确保分析覆盖全面且不重复。
🦋2. 透视分析的 Skill 调用
在 OpenClaw 中,你可以这样调用透视分析功能:
请帮我做透视分析:/path/to/data.xlsx
分析要求:
1. 按月份汇总销售额和销售量。
2. 按区域汇总销售额,计算各区域占比。
3. 按品类汇总销售额,计算各品类占比。
4. 组合分析:各区域各品类的销售交叉分析。
5. 输出透视表和可视化图表。
OpenClaw 会自动生成透视表,并根据数据特点选择合适的图表类型:
- 时间维度 → 折线图
- 占比分析 → 饼图或堆叠柱状图
- 对比分析 → 柱状图
- 交叉分析 → 热力图
🦋3. 透视表配置示例
python
# OpenClaw 透视分析配置
pivot_config = {
"data_source": "/path/to/data.xlsx",
"pivot_tables": [
{
"name": "月度销售汇总",
"rows": ["月份"],
"values": {
"销售金额": "sum",
"销售数量": "sum"
}
},
{
"name": "区域销售汇总",
"rows": ["销售区域"],
"values": {
"销售金额": "sum"
},
"calculations": {
"占比": "销售金额 / SUM(销售金额)"
}
},
{
"name": "区域品类交叉分析",
"rows": ["销售区域"],
"columns": ["产品品类"],
"values": {
"销售金额": "sum"
}
}
]
}
🔎6.数据可视化实现方法
数据可视化不是"把数字变成图"那么简单,差的可视化只会让数据"沉默"甚至"说谎",而好的可视化能让数据"说话"。这一节,我们总结几个核心的可视化设计原则。
🦋原则一:选对图表类型
不同的数据关系适合不同的图表类型,见表4-5。
表4-5 不同数据关系对应的图表类型
| 数据关系 | 推荐图表类型 | 示例 | 不适用场景 |
|---|---|---|---|
| 比较大小 | 柱状图 | 各区域销售额对比 | 分类超过15个 |
| 占比结构 | 饼图/环形图 | 各品类销售占比 | 分类超过7个 |
| 趋势变化 | 折线图 | 月度销售趋势 | 数据点少于3个 |
| 分布情况 | 直方图/箱线图 | 客户消费金额分布 | 离散数据 |
| 相关性 | 散点图 | 广告投入与销售额关系 | 单一变量 |
| 地理分布 | 地图 | 各省份销售热力图 | 无地理属性 |
| 流程转化 | 漏斗图 | 销售漏斗分析 | 非流程数据 |
| 层级结构 | 树状图 | 组织架构或品类结构 | 无层级关系 |
| 排名变化 | 条形图 | 产品销量排名 | 无排名属性 |
| 目标达成 | 仪表盘图 | KPI完成率 | 无目标值 |
选错图表类型是新手最常见的错误。比如用饼图展示10个以上的分类,或者用折线图展示没有连续关系的数据。OpenClaw 会根据数据特点自动推荐图表类型,但你也要理解背后的逻辑。
🦋原则二:简化视觉元素
好的可视化是"做减法",不是"做加法"。
需要减掉的元素:
- 多余的网格线
- 不必要的图例
- 花哨的3D效果
- 过多的颜色
- 无关的装饰
保留的核心元素:
- 清晰的标题
- 必要的坐标轴标签
- 关键数据标签
- 统一的配色
记住一句话:"如果去掉这个元素,读者会看不懂吗?"如果不会,就去掉。
🦋原则三:突出重点信息
可视化不是为了展示所有数据,而是为了突出关键信息。
突出重点的方法:
- 颜色对比:用醒目颜色突出关键数据
- 大小对比:用大尺寸突出重要元素
- 位置突出:把关键信息放在视觉中心
- 标注说明:用文字标注解释关键数据
比如,你要展示"华东区销售额最高"这个结论,可以把华东区的柱子用红色,其他用灰色,并在柱子上标注具体数值。
🦋原则四:保持一致性
同一份报告中的图表要保持风格一致。
需要一致的元素:
- 配色方案
- 字体样式
- 图表尺寸
- 标签格式
- 坐标轴范围
一致性不仅是为了美观,更是为了减少读者的认知负担。如果每个图表都用不同的配色,读者要花额外精力去适应。
🦋原则五:考虑色觉障碍
如果你的图表只用颜色区分信息,存在色觉障碍的读者可能会看不懂。
解决方案:
- 除了颜色,还用形状、纹理、标签区分
- 避免红绿对比(最常见的色觉障碍类型)
- 使用色觉友好型配色方案
OpenClaw 默认使用色觉友好型配色,但你也可以自定义。
🦋可视化 Skill 调用
在 OpenClaw 中,你可以这样调用可视化功能:
请帮我生成可视化图表:/path/to/data.xlsx
图表要求:
1. 区域销售对比:柱状图,突出显示销售额最高的区域。
2. 品类销售占比:饼图,显示各品类占比,突出TOP3。
3. 月度销售趋势:折线图,标注最高点和最低点。
4. 配色方案:使用商务蓝配色,保持色觉友好。
5. 输出格式:PNG,分辨率300DPI,适合PPT使用。
OpenClaw 会生成符合要求的图表,并自动应用设计原则。你也可以在生成后,用 OpenClaw 的设计 Skill 进一步调整。
可视化配置示例:
python
# OpenClaw 可视化配置
visualization_config = {
"charts": [
{
"type": "bar",
"title": "区域销售对比",
"data": {
"x": "销售区域",
"y": "销售金额"
},
"style": {
"orientation": "vertical",
"color_scheme": "business_blue",
"highlight_max": True,
"show_values": True,
"value_format": "{value:,.0f}"
},
"output": {
"format": "png",
"resolution": 300,
"size": [1200, 800]
}
},
{
"type": "pie",
"title": "品类销售占比",
"data": {
"labels": "产品品类",
"values": "销售金额"
},
"style": {
"show_top_n": 5,
"others_label": "其他",
"show_percentages": True
}
},
{
"type": "line",
"title": "月度销售趋势",
"data": {
"x": "月份",
"y": "销售金额"
},
"style": {
"show_points": True,
"annotate_extremes": True,
"smooth_line": True
}
}
]
}
🔎附:AI提示词模板与完整回答示例
以下是一个典型的AI提示词模板 ,用于让 OpenClaw 数字员工执行"销售数据自动化分析"任务。同时,我会给出该 Agent 可能产生的完整回答/执行报告。
🦋提示词模板(用户在飞书中@数字员工输入)
@我的数字员工
【任务名称】:销售数据自动化分析与洞察报告
【输入文件】:飞书云文档中的"2024上半年销售数据.xlsx",文件链接:https://feishu.cn/file/sales_2024_h1
【任务目标】:
请对这份销售数据执行以下完整分析流程:
1. **数据清洗**:
- 检查并处理空值、重复值、异常值
- 统一日期格式为 YYYY-MM-DD
- 标准化区域名称(华东区→华东,华南区→华南)
- 输出清洗报告,说明每一步处理了多少数据
2. **透视分析**:
- 按月份汇总销售额和销售量(月度趋势)
- 按区域汇总销售额,并计算各区域占比
- 按产品品类汇总销售额,并计算各品类占比
- 生成区域×品类的交叉销售分析表
3. **可视化**:
- 月度销售趋势折线图(标注最高点和最低点)
- 区域销售对比柱状图(突出最高区域)
- 品类销售占比饼图(显示TOP5,其余归为"其他")
4. **洞察报告**:
- 总结销售表现最好的区域和品类
- 指出销售增长最慢的区域和品类
- 给出3条具体的业务改进建议
- 报告字数控制在500字以内,适合发给管理层
【输出要求】:
- 所有清洗后的数据和分析结果保存到新文件"销售分析报告_2026H1.xlsx"中,包含多个工作表
- 图表保存为PNG格式,放到飞书云文档"销售分析图表"文件夹
- 洞察报告以飞书消息形式发送给我本人,同时抄送到"销售管理群"
- 所有操作请在3分钟内完成
【注意事项】:
- 如果数据量超过1万行,可以只抽样分析前5000行
- 异常值判定使用 IQR 方法(1.5倍四分位距)
- 对于缺失的销售金额,用该品类的平均销售金额填充
🦋AI Agent(数字员工)的完整回答(飞书消息)
@张伟 您好!您要求的"销售数据自动化分析与洞察报告"任务已完成。以下是执行报告及分析结果。
---
## 📊 销售数据分析执行报告
**执行时间**:2026-04-17 10:23:15 - 10:25:42(耗时2分27秒)
**输入文件**:2024上半年销售数据.xlsx(共5,000行,8列)
**输出文件**:销售分析报告_2026H1.xlsx(6个工作表)
**图表数量**:3张PNG图片
---
### 一、数据清洗报告
| 检查项 | 发现问题 | 处理方式 | 处理后数据 |
|--------|----------|----------|------------|
| 空值 | 订单日期3行,销售人员2行 | 删除空值行 | 删除5行 |
| 重复值 | 完全重复记录8条 | 删除重复 | 删除8行 |
| 异常值 | 销售金额>10万元(2条) | 标记为异常,保留 | 标记2行 |
| 日期格式 | 5种不同格式 | 统一为YYYY-MM-DD | 全部转换 |
| 区域名称 | "华东区""华东地区"→"华东" | 标准化映射 | 统一为4个区域 |
**清洗后数据**:4,987行,完整率99.74%
---
### 二、透视分析结果(摘要)
#### 月度销售趋势(1-6月)
| 月份 | 销售额(万元) | 销售量(台) | 环比增长 |
|------|----------------|--------------|----------|
| 1月 | 328 | 410 | - |
| 2月 | 295 | 368 | -10.1% |
| 3月 | 412 | 515 | +39.7% |
| 4月 | 456 | 570 | +10.7% |
| 5月 | 489 | 611 | +7.2% |
| 6月 | 523 | 654 | +7.0% |
**趋势**:2月因春节假期略有下滑,3月起持续增长,6月达到峰值。
#### 区域销售占比
| 区域 | 销售额(万元) | 占比 |
|------|----------------|------|
| 华东 | 1,058 | 35.2% |
| 华南 | 872 | 29.0% |
| 华北 | 612 | 20.4% |
| 西南 | 463 | 15.4% |
**结论**:华东区贡献超过三分之一销售额,是核心市场。
#### 品类销售占比(TOP5)
| 品类 | 销售额(万元) | 占比 |
|------|----------------|------|
| 空调 | 1,120 | 37.3% |
| 冰箱 | 685 | 22.8% |
| 洗衣机 | 412 | 13.7% |
| 电视 | 298 | 9.9% |
| 小家电 | 186 | 6.2% |
| 其他 | 310 | 10.3% |
**结论**:空调和冰箱合计占比超60%,是主力品类。
#### 区域×品类交叉分析(销售额,万元)
| 区域 | 空调 | 冰箱 | 洗衣机 | 电视 |
|------|------|------|--------|------|
| 华东 | 420 | 280 | 158 | 120 |
| 华南 | 350 | 210 | 98 | 95 |
| 华北 | 230 | 125 | 86 | 61 |
| 西南 | 120 | 70 | 70 | 22 |
**洞察**:华东在空调品类上优势明显;西南区各品类均偏弱。
---
### 三、可视化图表
已生成3张PNG图表,保存至飞书云文档"销售分析图表"文件夹:
1. `月度销售趋势.png`(折线图,标注了3月最高增长点)
2. `区域销售对比.png`(柱状图,华东柱为红色,其他为灰色)
3. `品类销售占比.png`(饼图,TOP5品类+其他)
---
### 四、洞察报告(精简版,适合管理层)
**一、整体表现**
2024年上半年总销售额3,005万元,销售量2,728台。自3月起连续4个月正增长,6月达到峰值523万元,增长势头良好。
**二、明星区域与品类**
- **华东区**贡献35.2%销售额,其中空调销售额420万元,占该区域40%,是核心引擎。
- **空调品类**占整体销售额37.3%,且在各区域均排名第一,应继续加大资源投入。
**三、增长机会点**
- **西南区**销售额仅占15.4%,各品类均低于平均水平,尤其是空调(120万元,仅为华东的29%)。建议在西南区增加渠道投入或促销活动。
- **小家电**品类占比仅6.2%,但增长潜力大(5-6月环比增长18%)。可考虑作为下半年的重点扶持品类。
**四、风险提示**
- 2月销售额环比下滑10.1%,春节档期需提前规划促销。
- 异常值中有2笔单笔超过10万元的订单(分别为12万和15万),已标记,建议业务部门核实是否为真实大单或录入错误。
**五、改进建议**
1. **资源倾斜**:下半年将空调新品首发优先安排在华东区,并配合区域营销。
2. **弱势区域**:在西南区开展"空调以旧换新"活动,提升市场份额。
3. **品类拓展**:在小家电品类增加SKU,并在华南区试点"小家电节"。
---
## ✅ 后续建议
- 我已将清洗后的完整数据、透视表、图表和分析报告打包为 `销售分析报告_2026H1.xlsx`,保存在您的飞书云文档根目录。
- 是否需要我根据上述建议,自动生成一份 PPT 草稿?如需,请回复"生成PPT"。
- 建议每月1号自动运行此分析,是否需要设置定时任务?回复"设置定时"即可。
------ 您的数字员工 🤖