【数据分析面试】6.计算对话总数(SQL)

题目:计算对话总数

给定了名为 messenger_sends 的消息发送表格,找出总共有多少个唯一的对话。

注:在某些记录中,receiver_idsender_id 从初始消息中互换了。这些记录应视为同一个对话。

示例:

输入:

messenger_sends 表格

列名 类型
id 整数
receiver_id 整数
sender_id 整数

输出:

列名 类型
total_conv_threads 整数

答案

解题思路

要计算总共有多少个对话,首先需要考虑到对话是由一系列消息组成的,并且在某些情况下,消息的发送者和接收者可能会被交换。因此,我们需要将这些交换的情况考虑在内,将发送者和接收者的ID合并在一起,然后对这些合并后的ID进行计数。

也就是说,如果一条消息的receiver_id是A,sender_id是B,那么这条消息和receiver_id是B,sender_id是A的消息属于同一个对话。

我们可以创建一个新的列,将receiver_idsender_id按照由大到小的顺序组合起来。然后,我们可以对这个新列进行去重统计,得到的结果就是对话的总数量。

答案代码

SELECT
	--计算唯一对话总数
    COUNT(DISTINCT thread_id) AS total_conv_threads
FROM
    (
    --重新组合对话双方id
        SELECT
            CASE
                WHEN sender_id < receiver_id THEN CONCAT(sender_id, '_', receiver_id)
                ELSE CONCAT(receiver_id, '_', sender_id)
            END AS thread_id
        FROM
            messenger_sends
    ) AS threads;

CONCAT()用法总结

在MySQL中,CONCAT() 函数用于将两个或多个字符串连接成一个更长的字符串。它接受一个或多个字符串作为参数,并返回连接后的结果。例如:

sql 复制代码
SELECT CONCAT('Hello', ' ', 'World'); -- 输出:Hello World

SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM users; -- 将 first_name 和 last_name 字段连接成一个 full_name 字段

SELECT CONCAT('The user with ID ', user_id, ' has email: ', email) AS user_info FROM users; -- 使用字段值与常量字符串连接成一个信息字符串

MySQL中, CONCAT()函数主要用于的字符串连接,而Python中的字符串连接使用 + 操作符或 str.join() 方法,Pandas的pd.concat()函数则用于用于合并 Pandas 数据结构,如 DataFrame 或 Series 对象。

代码汇总

--题目:求对话数量
-- 创建messenger_sends表格
CREATE TABLE messenger_sends (
    id INT AUTO_INCREMENT PRIMARY KEY,
    receiver_id INT,
    sender_id INT
);

--插入数据
INSERT INTO messenger_sends(receiver_id, sender_id) VALUES
(1, 2),
(2, 1),
(1, 2),
(1, 2),
(2, 1),
(3, 1),
(3, 1),
(3, 2),
(4, 5),
(5, 4),
(4, 5),
(5, 1),
(5, 1),
(5, 1),
(6, 7),
(8, 7),
(7, 9),
(7, 10);

--答案:求对话数量
SELECT
    COUNT(DISTINCT thread_id) AS total_conv_threads
FROM
    (
        SELECT
            CASE
                WHEN sender_id < receiver_id THEN CONCAT(sender_id, '_', receiver_id)
                ELSE CONCAT(receiver_id, '_', sender_id)
            END AS thread_id
        FROM
            messenger_sends
    ) AS threads;
相关推荐
SelectDB技术团队6 分钟前
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
大数据·数据库·数据仓库·数据分析·doris
inventecsh22 分钟前
mongodb基础操作
数据库·mongodb
白云如幻26 分钟前
SQL99版链接查询语法
数据库·sql·mysql
陪学40 分钟前
百度遭初创企业指控抄袭,维权还是碰瓷?
人工智能·百度·面试·职场和发展·产品运营
爱吃烤鸡翅的酸菜鱼1 小时前
MySQL初学之旅(4)表的设计
数据库·sql·mysql·database
statistican_ABin2 小时前
R语言数据分析案例45-全国汽车销售数据分析(可视化与回归分析)
数据挖掘·数据分析
The_Ticker2 小时前
CFD平台如何接入实时行情源
java·大数据·数据库·人工智能·算法·区块链·软件工程
Elastic 中国社区官方博客2 小时前
Elasticsearch 开放推理 API 增加了对 IBM watsonx.ai Slate 嵌入模型的支持
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
企鹅侠客2 小时前
ETCD调优
数据库·etcd
Json_181790144802 小时前
电商拍立淘按图搜索API接口系列,文档说明参考
前端·数据库