大数据-玩转数据-Flink App市场推广统计

一、说明

电商网站中已经有越来越多的用户来自移动端,相比起传统浏览器的登录方式,手机APP成为了更多用户访问电商网站的首选。对于电商企业来说,一般会通过各种不同的渠道对自己的APP进行市场推广,而这些渠道的统计数据(比如,不同网站上广告链接的点击量、APP下载量)就成了市场营销的重要商业指标。

二、思路

统计 不同渠道的不同用户行为

三、数据准备

封装数据的JavaBean类

java 复制代码
package com.lyh.flink06;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

@Data
@AllArgsConstructor
@NoArgsConstructor
public class MarketingUserBehavior {
    private Long userId;
    private String behavior;
    private String channel;
    private Long timestamp;
}

四、代码

java 复制代码
package com.lyh.flink06;

import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;

import java.util.Random;

public class Project_AppAnalysis_By_Chanel {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(2);
        env.addSource(new AppSource())
                .map(new MapFunction<MarketingUserBehavior, Tuple2<String,Long>>() {
                    @Override
                    public Tuple2<String, Long> map(MarketingUserBehavior value) throws Exception {
                        return Tuple2.of(value.getBehavior() + "_" + value.getChannel(),1L);
                    }
                }).keyBy(0)
                .sum(1)
        .print();
         env.execute();
    }
    public static class AppSource implements SourceFunction<MarketingUserBehavior> {

        @Override
        public void run(SourceContext<MarketingUserBehavior> ctx) throws Exception {
            Random random = new Random();
            String[] behaviors = {"update", "install", "uninstall", "update"};
            String[] chanels ={"HW","VIVO","XIAOMI","OPPO"};

            while (true){

                Long userId = (long)(random.nextInt(2000) + 1);
                String behavior = behaviors[random.nextInt(behaviors.length)];
                String chanel = chanels[random.nextInt(chanels.length)];
                Long timstampes = System.currentTimeMillis();


                ctx.collect(new MarketingUserBehavior(
                        userId,
                        behavior,
                        chanel,
                        timstampes

                ));
                Thread.sleep(200);
            }

        }

        @Override
        public void cancel() {
        }
    }

}

五、运行结果

相关推荐
小坏讲微服务2 小时前
MaxWell中基本使用原理 完整使用 (第一章)
大数据·数据库·hadoop·sqoop·1024程序员节·maxwell
勇往直前plus4 小时前
ElasticSearch详解(篇一)
大数据·elasticsearch·jenkins
一只小青团6 小时前
Hadoop之HDFS
大数据·hadoop·分布式
ITVV6 小时前
hadoop-3.4.1 单机伪部署
大数据·linux·hadoop
小杜谈数7 小时前
企业BI建议--数据治理平台
大数据
谅望者7 小时前
数据分析笔记07:Python编程语言介绍
大数据·数据库·笔记·python·数据挖掘·数据分析
中国国际健康产业博览会10 小时前
2026第35届中国国际健康产业博览会探索健康与科技的完美结合!
大数据·人工智能
Lansonli11 小时前
大数据Spark(七十三):Transformation转换算子glom和foldByKey使用案例
大数据·分布式·spark
中电金信11 小时前
2025新加坡金融科技节:看AI驱动的金融转型策略与“中国方案”
大数据·人工智能·金融
武子康14 小时前
Java-174 FastFDS 从单机到分布式文件存储:实战与架构取舍
java·大数据·分布式·性能优化·系统架构·dfs·fastdfs