数据分析之技术干货业务价值 powerquery 分组排序后取TOP

在电商中,我们要对货品进行分析,由于所有的销售数据都在一起,货品信息也在一起,两个表建立了关系之后,要看每个品类的TOP款有哪些,每个品类的TOP款是什么要怎么做呢?

下面是我做数据的思路:

1、分析需求与明确业务目的(重要)

2、根据需求分析数据源,

3、整理链接数据源,现将所有数据连接在一起,可以做一张宽表,也可以建立模型设置表关系,看自己擅长什么方式。

4、根据目的对数据源用适当的方式进行聚合
5、检查数据准确性

6、表格呈现,呈现的方式要直观符合领导的习惯

7、根据反馈去改正:反馈是很重要的,根据反馈去处理反馈我们才能之后的提升。(重要)

具体的细节下钻我就不展开说了,今天我说一下我工作中的一个常用的分组排序取TOP

我用的工具是powerquery,

在分组之后,我们要对每一个组进行处理分组之后是这个样子

分组就很简单我就不展开说了

分后就是要针对对table列中的每一个分最后的小组进行操作

我的操作就是

1、遍历table列,逐步操作每个表,

2、对于遍历的表我们进行排序,

3、排序后添加索引为排名

4、排名后我们过滤筛选小于21的就是TOP10

复制代码
= Table.TransformColumns(分组的行, {
        "table",
        each let
            排序表 = Table.Sort(_, {{"支付金额", Order.Descending}}),
            带索引表 = Table.AddIndexColumn(排序表, "索引", 1, 1),
            筛选表 = Table.SelectRows(带索引表, each [索引] < 21)
        in
            筛选表
    })
1. 当前实现逻辑​
  • ​核心步骤​​:

    1. 按品类分组生成子表(Table.Group);
    2. 对每个子表降序排序支付金额;
    3. 添加索引作为排名;
    4. 筛选索引 <21 的行(即Top 20)。
  • ​代码优势​​:

    • 利用 Table.TransformColumns 逐组处理,逻辑清晰;
    • 通过索引列确保排名唯一性,避免数据重复导致排名错乱。

技术工具类​ ​:
Power Query | M语言 | Table.TransformColumns | 分组排序 | 索引过滤

​业务场景类​ ​:
电商货品分析 | 品类TOP款 | 销售数据聚合 | 宽表建模 | 数据透视

​分析方法类​ ​:
分组处理 | 动态排名 | TOP N筛选 | 数据清洗 | 领导看板

相关推荐
sensen_kiss1 天前
INT303 Big Data Analysis 大数据分析 Pt.11 模型选择和词向量(Word Embeddings)
大数据·数据挖掘·数据分析
laocooon5238578861 天前
数据收集, 数据清洗,数据分析,然后可视化,都涉及哪些知识
数据挖掘·数据分析
企业智能研究1 天前
什么是数据治理?数据治理对企业有什么用?
大数据·人工智能·数据分析·agent
民乐团扒谱机1 天前
【微实验】数模美赛备赛MATLAB实战:一文速通各种“马尔可夫”(Markov Model)
开发语言·人工智能·笔记·matlab·数据挖掘·马尔科夫链·线性系统
_爱明1 天前
评估回归模型的指标与理解
人工智能·数据挖掘·回归
逻极1 天前
数据分析项目:Pandas + SQLAlchemy,从数据库到DataFrame的丝滑实战
python·mysql·数据分析·pandas·sqlalchemy
醉卧考场君莫笑1 天前
数据分析常用方法:上
数据挖掘·数据分析
小王毕业啦1 天前
2003-2023年 285个地级市邻接矩阵、经济地理矩阵等8个矩阵数据
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
2501_941803621 天前
在奥斯陆智能水利场景中构建实时水资源调度与高并发水质数据分析平台的工程设计实践经验分享
数据挖掘·数据分析·云计算
城数派1 天前
2001-2024年全球500米分辨率逐年土地覆盖类型栅格数据
大数据·人工智能·数据分析