获取每个访客的第一条访问日志(获取网站的UV)

-- 获取每个访客的第一条访问日志,初始化每个访客的第一个访问日志,计算UV

CREATE TABLE access_log_first (

id BIGINT,

ip STRING,

province STRING,

city STRING,

isp STRING,

access_time STRING,

access_hour STRING,

url STRING,

status STRING,

traffic STRING,

referer STRING,

ref_type STRING,

c_info STRING,

client_type STRING,

client_browser STRING

);


INSERT OVERWRITE TABLE access_log_first

SELECT a.id, a.ip, a.province, a.city, a.isp

, a.access_time, a.access_hour,a.url, a.status, a.traffic

, a.referer,a.ref_type, a.c_info, a.client_type, a.client_browser

FROM access_log a

JOIN (

SELECT c.ip,MIN(c.id) AS id

FROM access_log c

GROUP BY c.ip,c.c_info

) b

ON a.ip = b.ip

AND a.id = b.id;

这段 SQL 语句的作用是将满足特定条件的数据插入到名为access_log_first的表中。

具体解释如下:

一、整体结构

sql

INSERT OVERWRITE TABLE access_log_first SELECT... FROM access_log a JOIN... ON...;

这是一个标准的INSERT OVERWRITE语句结构,用于覆盖目标表中的数据。首先指定目标表为access_log_first,然后通过SELECT子句选择要插入的数据来源,这里的数据来源是从access_log表中选取,并通过连接操作筛选出特定的数据行。

二、选择插入的数据列

sql

SELECT a.id, a.ip, a.province, a.city, a.isp, a.access_time, a.access_hour,a.url, a.status, a.traffic, a.referer,a.ref_type, a.c_info, a.client_type, a.client_browser FROM access_log a

从access_log表(别名a)中选择了多个列,包括id、ip、province、city、isp等一系列与访问日志相关的字段。

三、连接子查询筛选数据

子查询部分:

sql

SELECT c.ip,MIN(c.id) AS id FROM access_log c GROUP BY c.ip,c.c_info

这个子查询从access_log表(别名c)中按照ip和c_info分组,然后为每个分组找到最小的id值。

连接条件:

sql

JOIN (... ) b ON a.ip = b.ip AND a.id = b.id

主查询中的access_log表(别名a)与子查询的结果集(别名b)进行连接,连接条件是a.ip = b.ip和a.id = b.id,即根据ip和id进行匹配,确保插入到目标表中的数据是每个ip下最小id对应的那一行数据。

综上所述,这段 SQL 语句的目的是从access_log表中筛选出每个ip下特定的数据行,并将这些数据插入到access_log_first表中,实现了对数据的筛选和整理。

相关推荐
一线大码9 分钟前
SpringBoot 优雅实现接口的多实现类方式
java·spring boot·后端
DARLING Zero two♡13 分钟前
【Linux操作系统】简学深悟启示录:进程间通信
linux·运维·服务器
花伤情犹在14 分钟前
Java Stream 高级应用:优雅地扁平化(FlatMap)递归树形结构数据
java·stream·function·flatmap
yaoxin52112327 分钟前
212. Java 函数式编程风格 - Java 编程风格转换:命令式 vs 函数式(以循环为例)
java·开发语言
摇滚侠37 分钟前
Spring Boot 3零基础教程,WEB 开发 Thymeleaf 属性优先级 行内写法 变量选择 笔记42
java·spring boot·笔记
滑水滑成滑头38 分钟前
**发散创新:多智能体系统的探索与实践**随着人工智能技术的飞速发展,多智能体系统作为当今研究的热点领域,正受到越来越多关注
java·网络·人工智能·python
摇滚侠41 分钟前
Spring Boot 3零基础教程,WEB 开发 Thymeleaf 总结 热部署 常用配置 笔记44
java·spring boot·笔记
十年小站42 分钟前
一、新建一个SpringBoot3项目
java·spring boot
2401_8414956444 分钟前
【数据结构】最长的最短路径的求解
java·数据结构·c++·python·算法·最短路径·图搜索
麦麦鸡腿堡1 小时前
Java的代码块介绍与快速入门
java·开发语言