mysql 全文索引中的Stopwords

Full-Text Stopwords 是指在全文搜索时被索引系统默认忽略的一组单词。这些通常是最常见的单词,比如 "the"、"is"、"at" 等英语中的助词、介词、连接词等。它们通常不含有具体的搜索意义,因此在创建全文索引的时候会被排除在外,以便减少索引大小并提高搜索效率。

在 MySQL 中使用全文索引和搜索时,Stopwords 的作用如下:

  1. 索引构建 - 当创建全文索引时,Stopwords 不会被包括在内。这意味着,如果你的搜索关键字包含了这些词,它们不会出现在索引结果中。

  2. 搜索查询 - 当执行全文搜索时,如果搜索字符串包含 Stopwords,那么这些词将不会被用于匹配。

你可以通过查看 MySQL 的官方文档来获取默认的 Stopword 列表,并根据需要修改它。例如,在 MyISAM 引擎中,停用词列表存储在 storage/myisam/ft_static.c 文件中,而 InnoDB 引擎的停用词列表是由服务器变量 innodb_ft_default_stopword 指定的表。

若要改变默认的停用词集合,你可以进行以下操作:

  1. 自定义停用词表 - 通过设置系统变量(例如 ft_stopword_file)来指定自己的停用词文件路径,或者对于 InnoDB 表,通过给 innodb_ft_server_stopword_table 设置一个指向你自己停用词表的值。

  2. 重新生成索引 - 更改停用词表后,相关的全文索引需要重建,以确保新的停用词列表生效。

  3. 使用IN BOOLEAN MODE搜索 - 如果你想在搜索时忽略停用词列表,可以在全文搜索中使用 IN BOOLEAN MODE 选项,这样即使是停用词也会被用于搜索匹配。

举例来说,如果你对一个包含文章文本的列使用全文索引搜索,但希望 "the" 和 "is" 这样的常见单词能够在搜索中匹配,你可能需要自定义停用词表或使用 IN BOOLEAN MODE 进行搜索。

请注意,调整停用词列表可能影响搜索结果的相关性和性能,因此应谨慎进行。

相关推荐
一匹电信狗22 分钟前
【MySQL】数据库表的操作
linux·运维·服务器·数据库·mysql·ubuntu·小程序
api_1800790546032 分钟前
性能优化揭秘:将淘宝商品 API 响应时间从 500ms 优化到 50ms 的技术实践
大数据·数据库·性能优化·数据挖掘
白衣鸽子33 分钟前
MySQL 时间类型深度解析:精度、时区陷阱与版本兼容
数据库·后端·mysql
冲上云霄的Jayden37 分钟前
MySQL InnoDB 状态(SHOW ENGINE INNODB STATUS)深度分析与性能优化建议
数据库·mysql·性能优化·innodb
元闰子2 小时前
怎么让程序更高效地连起来?
数据库·redis·mysql
洲覆2 小时前
Redis 内存淘汰策略
开发语言·数据库·redis·缓存
胖头鱼的鱼缸(尹海文)2 小时前
数据库管理-第376期 Oracle AI DB 23.26新特性一览(20251016)
数据库·人工智能·oracle
麦聪聊数据2 小时前
浅谈SQL审核(一):SQL审核实现方式与常见工具的选择
数据库·sql
ajassi20002 小时前
开源 Linux 服务器与中间件(七)数据库--MySQL
linux·服务器·数据库·ubuntu·开源
韩立学长3 小时前
【开题答辩实录分享】以《自然灾害隐患点管理信息系统》为例进行答辩实录分享
数据库·spring boot