【MongoDB】索引 – 文本索引

一、准备工作

这里准备一些数据

bash 复制代码
db.books.insertMany([
    {_id: 1, name: "Java", description: "java 入门图书", translation: [{ language: "english", description: "java basic book" }]},
    {_id: 2, name: "C++", description: "C++ 入门图书", translation: [{ language: "english", description: "c++ basic book" }]},
    {_id: 3, name: "Java设计模式", description: "java 设计模式", translation: [{ language: "english", description: "c++ design mode" }]}
]);

二、创建索引

1、创建索引

bash 复制代码
db.books.createIndex({description: 'text'});

上面创建了description字段的文本索引

2、查询索引

bash 复制代码
db.books.getIndexes();

结果如下:

可以看到多了一个名称为description_text的索引;另外可以看到索引中有权重(weights)、默认语言(default_language)、指定语言字段(language_override)、文本索引版本(textIndexVersion)

三、示例:使用英文查询

1、执行查询

bash 复制代码
db.books.find ({$text: { $search: 'java'}});

结果如下:

2、执行过程

bash 复制代码
db.books.find ({$text: { $search: 'java'}}).explain();

结果如下:

可以看到查询过程中会使用到索引名称为description_text的索引

四、示例:使用中文查询

1、执行查询

bash 复制代码
db.books.find ({$text: { $search: '入门语言'}});

结果如下:

2、执行过程

bash 复制代码
db.books.find ({$text: { $search: '入门语言'}}).explain();

结果如下:

可以看到查询过程中会使用到索引名称为description_text的索引

五、示例:使用中文查询

1、执行查询

bash 复制代码
db.books.find ({$text: { $search: '入门'}});

查询不到任何结果

2、执行过程

bash 复制代码
db.books.find ({$text: { $search: '入门'}}).explain();

结果如下:

可以看到查询过程中会使用到索引名称为description_text的索引

3、分析

在创建文本索引时,会先对文本进行分词,根据分词后的结果建立索引;这里分词使用的是空格,所以使用java或者入门语言进行搜索时都可以查询到结果,而使用入门进行搜索时却无法查询到任何数据。

相关推荐
SelectDB44 分钟前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
葫芦和十三10 小时前
图解 MongoDB 22|读写关注:持久性与一致性的档位选择
后端·mongodb·agent
葫芦和十三17 小时前
图解 MongoDB 21|选举与 failover:Primary 是怎么选出来的
后端·mongodb·agent
jiayou641 天前
KingbaseES 表级与列级加密完全指南
数据库·后端
葫芦和十三2 天前
图解 MongoDB 19|Oplog:复制的真正载体,不是文档是操作
后端·mongodb·agent
葫芦和十三2 天前
图解 MongoDB 20|复制延迟与 catch up:Secondary 为什么跟不上
后端·mongodb·agent
GBASE2 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
CSharp精选营2 天前
关系型 vs 非关系型:从原理到选型,一文搞定数据库核心分类
数据结构·nosql·关系型数据库·非关系型数据库·技术选型
xiezhr2 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
吃糖的小孩3 天前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库