MySQL中FIND_IN_SET函数的深度解析与应用指南

知其然要知其所以然,探索每一个知识点背后的意义,你知道的越多,你不知道的越多,一起学习,一起进步,如果文章感觉对您有用的话,关注、收藏、点赞,有困惑的地方请评论,我们一起交流!


一、FIND_IN_SET基础用法

1. 函数语法

sql 复制代码
FIND_IN_SET(str, strlist)
  • str:待查找的字符串。
  • strlist:逗号分隔的字符串列表。
  • 返回值
    • 找到:返回位置索引(从1开始)。
    • 未找到:返回 0
    • 任一参数为 NULL:返回 NULL

2. 简单示例

sql 复制代码
SELECT FIND_IN_SET('apple', 'apple,banana,orange');  -- 返回 1
SELECT FIND_IN_SET('banana', 'apple,banana,orange'); -- 返回 2
SELECT FIND_IN_SET('grape', 'apple,banana,orange');  -- 返回 0

二、典型使用场景(及风险)

1. 简单标签匹配

假设有一个 articles 表,其中 tags 字段存储逗号分隔的标签:

sql 复制代码
SELECT * FROM articles 
WHERE FIND_IN_SET('tech', tags) > 0;

问题:全表扫描、无法利用索引、数据冗余。

2. 权限校验

用户表 users 包含 permissions 字段(如 'read,write,delete'):

sql 复制代码
SELECT * FROM users 
WHERE FIND_IN_SET('write', permissions) > 0;

隐患:权限管理耦合在字符串中,难以维护。


三、深度解析

1. 底层实现机制

  • 字符串分割 :将 strlist 按逗号拆分为临时数组。
  • 遍历匹配:逐个对比元素,直到找到匹配项。
  • 时间复杂度:O(n),对大字符串或大数据集性能急剧下降。

2. 性能问题实测

sql 复制代码
EXPLAIN SELECT * FROM large_table WHERE FIND_IN_SET('value', csv_column);
  • 执行计划 :通常显示 ALL(全表扫描),即使 csv_column 有索引。

3. 与替代方案的对比

方法 性能 可维护性 索引支持 符合范式
FIND_IN_SET 不支持
关联表 (JOIN) 支持
JSON_CONTAINS 部分支持

四、更优替代方案

1. 关联表设计(规范化)

sql 复制代码
-- 原始表
CREATE TABLE articles (
    id INT PRIMARY KEY,
    title VARCHAR(255)
);

-- 标签关联表
CREATE TABLE article_tags (
    article_id INT,
    tag VARCHAR(50),
    PRIMARY KEY (article_id, tag),
    FOREIGN KEY (article_id) REFERENCES articles(id)
);

-- 查询示例
SELECT a.* FROM articles a
JOIN article_tags t ON a.id = t.article_id
WHERE t.tag = 'tech';

优势:索引支持、易于统计、避免数据冗余。

2. 使用JSON类型(MySQL 5.7+)

sql 复制代码
ALTER TABLE articles ADD COLUMN tags JSON;

-- 查询示例
SELECT * FROM articles 
WHERE JSON_CONTAINS(tags, '"tech"', '$');

优势:支持JSON索引、查询效率较高。

3. 使用ES(ES主要是帮助业务检索负责数据)


五、何时可以考虑使用FIND_IN_SET?

  1. 临时数据分析:快速查询非规范化数据。
  2. 小型静态表:数据量小且不频繁查询。
  3. 遗留系统适配:暂时无法修改表结构时。

六、总结

  • 慎用场景FIND_IN_SET 在大多数生产环境中应避免使用,尤其是在高并发或大数据表上。
  • 设计原则
    • 优先遵循数据库第一范式(1NF)。
    • 使用关联表或JSON类型替代逗号分隔字符串。
  • 迁移建议:逐步将现有逗号分隔字段重构为关联表,结合业务需求评估代价。
相关推荐
间彧5 分钟前
Redis Stream相比阻塞列表和发布订阅有哪些优势?适合什么场景?
后端
间彧10 分钟前
Redis阻塞弹出和发布订阅模式有什么区别?各自适合什么场景?
后端
苏三说技术18 分钟前
统计接口耗时的6种常见方法
后端
SimonKing24 分钟前
Mybatis-Plus的竞争对手来了,试试 MyBatis-Flex
java·后端·程序员
光军oi30 分钟前
JAVA全栈JVM篇————初识JVM
java·开发语言·jvm
我命由我1234535 分钟前
PDFBox - PDFBox 加载 PDF 异常清单(数据为 null、数据为空、数据异常、文件为 null、文件不存在、文件异常)
java·服务器·后端·java-ee·pdf·intellij-idea·intellij idea
渣哥40 分钟前
当容器里有多个 Bean,@Qualifier 如何精准定位?
javascript·后端·面试
7哥♡ۣۖᝰꫛꫀꪝۣℋ42 分钟前
Spring Boot
java·spring boot·后端
Moniane43 分钟前
C++深度解析:从核心特性到现代编程实践
java·开发语言·jvm
攻城狮CSU1 小时前
C# 数据加载专题 之泛型序列化
java·servlet·c#