《微服务即使通讯中ES的作用》

在本项目中, Elasticsearch (ES) 主要用于存储 用户信息 和 聊天消息 ,其核心目的是提供 高性能的全文搜索和多维度检索能力 。

以下是详细的技术分析:

1. ES 存储了什么?

根据 data_es.hpp 中的定义,ES 维护了两个核心索引:

A.用户信息索引 ( user index)

存储了用户的基本信息字段,用于好友搜索或用户查找:

  • user_id : 用户唯一 ID (keyword)。
  • nickname : 用户昵称 (text,支持全文检索)。
  • phone : 绑定手机号 (keyword)。
  • description : 个人签名 (text,支持全文检索)。
  • avatar_id : 头像文件 ID。

B.聊天消息索引 ( message index)

存储了聊天记录的文本内容及元数据,用于历史消息搜索:

  • message_id : 消息唯一 ID。
  • user_id : 发送者 ID。
  • chat_session_id : 所属会话 ID。
  • create_time : 消息创建时间。
  • content : 消息正文内容 (text,支持关键词搜索)。

2. 为什么要用 ES 存储?

虽然 MySQL 也存储了这些数据,但引入 ES 是为了解决关系型数据库在搜索场景下的短板:

A. 强大的全文搜索能力

  • MySQL 的局限 :在 MySQL 中使用 LIKE '%关键词%' 进行模糊查询会导致 索引失效 ,触发全表扫描,在百万级以上数据量时性能极差。
  • ES 的优势 :ES 基于 倒排索引 (Inverted Index) 技术,能够秒级完成对昵称、签名或消息内容的模糊搜索,支持分词匹配(例如搜索"吃饭",能匹配到"你吃饭了吗")。

B. 复杂条件下的高性能检索

  • 在 search 方法中(见 data_es.hpp:L51-75 ),系统需要同时根据 phone 、 user_id 、 nickname 进行 should 匹配(或关系),并排除掉已有的好友 ( must_not )。这种 多字段布尔组合查询 是 ES 的强项,性能远超 MySQL 的多表关联或复杂 OR 查询。

C. 搜索结果的相关性评分

  • ES 能够根据关键词匹配度给出评分(Score),让搜索结果按"最匹配"排序。例如搜索消息时,内容完全匹配的消息会排在前面,这在 IM 系统的"搜索聊天记录"功能中体验更好。

D. 实现读写分离与架构解耦

  • 核心链路用 MySQL :注册、登录、发送消息等核心事务逻辑使用 MySQL,保证数据的一致性和可靠性。
  • 搜索链路用 ES :将耗时的搜索压力转移到专门为搜索优化的 ES 集群上,避免复杂的搜索查询拖慢数据库,提高系统的整体稳定性

总结

在注册环节写入 ES,是为了确保用户一旦注册成功,就能立即被其他用户通过搜索(昵称或手机号)找到。这是实现 IM 系统"找朋友"和"搜消息"功能的基石。

相关推荐
pearbing26 分钟前
天猫UV量提高实用指南:找准方向,稳步突破流量瓶颈
大数据·uv·天猫uv量提高·天猫uv量·uv量提高·天猫提高uv量
Dxy12393102162 小时前
Elasticsearch 索引与映射:为你的数据打造一个“智能仓库”
大数据·elasticsearch·搜索引擎
岁岁种桃花儿2 小时前
Kafka从入门到上天系列第一篇:kafka的安装和启动
大数据·中间件·kafka
Apache Flink3 小时前
Apache Flink Agents 0.2.0 发布公告
大数据·flink·apache
永霖光电_UVLED3 小时前
打造更优异的 UVB 激光器
大数据·制造·量子计算
m0_466525293 小时前
绿盟科技风云卫AI安全能力平台成果重磅发布
大数据·数据库·人工智能·安全
晟诺数字人3 小时前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营
vx_biyesheji00013 小时前
豆瓣电影推荐系统 | Python Django 协同过滤 Echarts可视化 深度学习 大数据 毕业设计源码
大数据·爬虫·python·深度学习·django·毕业设计·echarts
2501_943695333 小时前
高职大数据与会计专业,考CDA证后能转纯数据分析岗吗?
大数据·数据挖掘·数据分析
实时数据4 小时前
通过大数据的深度分析与精准营销策略,企业能够有效实现精准引流
大数据