Excel 高阶实战:从脏数据到可视化报告的完整闭环

前两篇我们已经把 Excel 的地基打牢,这一篇直接上"战场"。我会用一个真实电商订单数据案例,带你走完"脏数据 → 清洗 → 分析 → 可视化 → 自动化报告"的完整闭环。所有公式、快捷键、坑点都会逐行拆解,复制粘贴即可用。

场景设定:双 11 后 10 万条订单的生死时速

假设你是运营,老板甩过来一份 10 万行的 CSV:

• 日期格式混乱(2025/11/11、11-11-25、20251111...)

• 商品标题里藏着"【预售】""(赠品)"等噪音

• 支付金额列混入"¥""NULL""--"

• 同一用户 UID 出现多次,需判断新老客

目标:30 分钟内产出三张图------

  1. 每日 GMV 趋势

  2. TOP10 品类销售额

  3. 新老客贡献占比

第一步:数据清洗三板斧

  1. 统一日期格式

在空白列输入:

公式

=--TEXT(A2,"0000-00-00")

把文本"20251111"强制转成真日期,再设置单元格格式为 yyyy-mm-dd。

  1. 清洗金额列

公式

=IFERROR(--SUBSTITUTE(SUBSTITUTE(E2,"¥",""),"NULL",),0)

双 SUBSTITUTE 去掉"¥"和"NULL",再用 IFERROR 把异常值变 0。

  1. 提取纯净品类名

公式

=TEXTBEFORE(TEXTAFTER(C2,"【"),"】")
利用 TEXTBEFORE + TEXTAFTER 组合拳,把"【手机】iPhone16"直接洗成"手机"。

第二步:IF + VOLATILE 函数实战

场景:标记新老客

思路:如果 UID 在整列中第一次出现 → 新客,否则老客。

公式(非数组版本)

=IF(COUNTIF(B2:B2,B2)=1,"新客","老客")

下拉自动扩展,COUNTIF 范围逐行扩大,性能在 10 万行内仍可接受。

高阶:VOLATILE 替代 OFFSET 做动态区域

传统 OFFSET 易卡,改用 INDEX 构造动态列:

定义名称 → 名称管理器

=INDEX(清洗!A:A,2):INDEX(清洗!A:A,COUNTA(清洗!A:A))

把这段命名成 DateCol,后续图表直接引用,文件体积瞬间瘦身 30%。

第三步:透视表 60 秒出图

  1. 每日 GMV

• 行:日期(按天)

• 值:支付金额(求和)

• 右键 → 组合 → 确保步长为"天"

  1. 品类 TOP10

• 行:清洗后的品类

• 值:支付金额(求和)

• 降序排序 → 前 10

  1. 新老客占比

• 列:新老客标记

• 值:支付金额(求和)

• 显示方式 → "总计的百分比"

第四步:一键刷新自动化

把 CSV 作为"数据连接"导入:

数据 → 获取数据 → 自文本/CSV → 选择文件 → 载入为表格 → 勾选"添加到数据模型"。

以后只需 数据 → 全部刷新 ,清洗列公式、透视表、图表同步更新,真正实现"数据源一换,报告秒出"。

彩蛋:条件格式预警

选中 GMV 列 → 开始 → 条件格式 → 数据条 → 红色渐变,低于日均 80% 的日期一眼识别。

💡 复盘清单

复制本文公式 → 替换列号 → 30 分钟交付老板。下一篇想深入 Power Query 还是动态数组函数?留言告诉我。

相关推荐
阿里云大数据AI技术20 小时前
StarRocks x Fluss x Paimon湖流一体方案:构建秒级响应、湖流一体的实时数据引擎
大数据·人工智能
Databend20 小时前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
喵个咪21 小时前
Go Wind UBA 拆解系列 - 架构总览:三服务、数据流与契约优先
大数据·后端·go
喵个咪21 小时前
Go Wind UBA 拆解系列 - 多租户与安全:两套隔离机制的边界
大数据·后端·go
喵个咪21 小时前
Go Wind UBA 拆解系列 - OLAP 与 SQL 硬核:25 个分析模型怎么落地
大数据·后端·go
喵个咪21 小时前
Go Wind UBA 拆解系列 - SDK 与采集层:从浏览器到 Kafka
大数据·后端·go
QCC产品中心1 天前
MiniMax Agent 接入实测:企业查询、股权穿透与 UBO 识别(附 Prompt 模板)
大数据·mcp·金融/非金融
SelectDB2 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
ApacheSeaTunnel2 天前
当多表数据涌入,Apache SeaTunnel 如何巧妙化解主键冲突?
大数据·开源·数据集成·seatunnel·技术分享·数据同步
大大大大晴天5 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据