【数据分析面试】6.计算对话总数(SQL)

题目:计算对话总数

给定了名为 messenger_sends 的消息发送表格,找出总共有多少个唯一的对话。

注:在某些记录中,receiver_idsender_id 从初始消息中互换了。这些记录应视为同一个对话。

示例:

输入:

messenger_sends 表格

列名 类型
id 整数
receiver_id 整数
sender_id 整数

输出:

列名 类型
total_conv_threads 整数

答案

解题思路

要计算总共有多少个对话,首先需要考虑到对话是由一系列消息组成的,并且在某些情况下,消息的发送者和接收者可能会被交换。因此,我们需要将这些交换的情况考虑在内,将发送者和接收者的ID合并在一起,然后对这些合并后的ID进行计数。

也就是说,如果一条消息的receiver_id是A,sender_id是B,那么这条消息和receiver_id是B,sender_id是A的消息属于同一个对话。

我们可以创建一个新的列,将receiver_idsender_id按照由大到小的顺序组合起来。然后,我们可以对这个新列进行去重统计,得到的结果就是对话的总数量。

答案代码

复制代码
SELECT
	--计算唯一对话总数
    COUNT(DISTINCT thread_id) AS total_conv_threads
FROM
    (
    --重新组合对话双方id
        SELECT
            CASE
                WHEN sender_id < receiver_id THEN CONCAT(sender_id, '_', receiver_id)
                ELSE CONCAT(receiver_id, '_', sender_id)
            END AS thread_id
        FROM
            messenger_sends
    ) AS threads;

CONCAT()用法总结

在MySQL中,CONCAT() 函数用于将两个或多个字符串连接成一个更长的字符串。它接受一个或多个字符串作为参数,并返回连接后的结果。例如:

sql 复制代码
SELECT CONCAT('Hello', ' ', 'World'); -- 输出:Hello World

SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM users; -- 将 first_name 和 last_name 字段连接成一个 full_name 字段

SELECT CONCAT('The user with ID ', user_id, ' has email: ', email) AS user_info FROM users; -- 使用字段值与常量字符串连接成一个信息字符串

MySQL中, CONCAT()函数主要用于的字符串连接,而Python中的字符串连接使用 + 操作符或 str.join() 方法,Pandas的pd.concat()函数则用于用于合并 Pandas 数据结构,如 DataFrame 或 Series 对象。

代码汇总

复制代码
--题目:求对话数量
-- 创建messenger_sends表格
CREATE TABLE messenger_sends (
    id INT AUTO_INCREMENT PRIMARY KEY,
    receiver_id INT,
    sender_id INT
);

--插入数据
INSERT INTO messenger_sends(receiver_id, sender_id) VALUES
(1, 2),
(2, 1),
(1, 2),
(1, 2),
(2, 1),
(3, 1),
(3, 1),
(3, 2),
(4, 5),
(5, 4),
(4, 5),
(5, 1),
(5, 1),
(5, 1),
(6, 7),
(8, 7),
(7, 9),
(7, 10);

--答案:求对话数量
SELECT
    COUNT(DISTINCT thread_id) AS total_conv_threads
FROM
    (
        SELECT
            CASE
                WHEN sender_id < receiver_id THEN CONCAT(sender_id, '_', receiver_id)
                ELSE CONCAT(receiver_id, '_', sender_id)
            END AS thread_id
        FROM
            messenger_sends
    ) AS threads;
相关推荐
一个天蝎座 白勺 程序猿41 分钟前
Apache IoTDB(5):深度解析时序数据库 IoTDB 在 AINode 模式单机和集群的部署与实践
数据库·apache·时序数据库·iotdb·ainode
QQ3596773451 小时前
ArcGIS Pro实现基于 Excel 表格批量创建标准地理数据库(GDB)——高效数据库建库解决方案
数据库·arcgis·excel
青鱼入云1 小时前
【面试场景题】支付&金融系统与普通业务系统的一些技术和架构上的区别
面试·金融·架构
学编程的小程1 小时前
突破局域网限制:MongoDB远程管理新体验
数据库·mongodb
掘金安东尼2 小时前
黑客劫持:周下载量超20+亿的NPM包被攻击
前端·javascript·面试
鸿乃江边鸟2 小时前
向量化和列式存储
大数据·sql·向量化
波波烤鸭2 小时前
Redis 高可用实战源码解析(Sentinel + Cluster 整合应用)
数据库·redis·sentinel
IT毕设梦工厂3 小时前
大数据毕业设计选题推荐-基于大数据的客户购物订单数据分析与可视化系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
l1t6 小时前
利用DeepSeek实现服务器客户端模式的DuckDB原型
服务器·c语言·数据库·人工智能·postgresql·协议·duckdb
在未来等你7 小时前
Elasticsearch面试精讲 Day 17:查询性能调优实践
大数据·分布式·elasticsearch·搜索引擎·面试