【SQL】筛选字符串与正则表达式

目录

语法

需求

示例

分析

代码


语法

SELECT column1, column2, ...

FROM table_name

WHERE condition;

WHERE 子句用于指定过滤条件,以限制从数据库表中检索的数据。当你执行一个查询时,WHERE 子句允许你筛选出满足特定条件的记录。如果记录满足 WHERE 子句中的条件,则这些记录会被包含在查询结果中;如果不满足条件,则这些记录会被排除在外。

  • WHERE 子句是在数据被检索之后但在结果被返回之前应用的。这意味着它不会减少数据库需要处理的数据量,但会限制最终返回给客户端的数据量。
  • 在使用 WHERE 子句时,确保条件正确无误,以避免返回错误的数据或意外的空结果集。
  • 对于大型数据库,合理的 WHERE 子句条件可以显著提高查询性能,因为它允许数据库系统更有效地定位和检索数据。
  • 在某些情况下,WHERE 子句可以与 GROUP BYHAVING 等子句结合使用,以实现更复杂的查询和数据聚合。然而,WHERE 子句在数据分组之前过滤记录,而 HAVING 子句在数据分组之后过滤分组。

SELECT column_name(s)

FROM table_name

WHERE column_name REGEXP pattern;

REGEXP(或其变种,如RLIKE,具体取决于数据库系统)是一个强大的文本搜索模式匹配操作符,它允许你使用正则表达式(Regular Expressions)来搜索数据库中的文本数据。正则表达式是一种特殊的文本字符串,用于描述搜索文本时应该匹配的模式。它们非常灵活,可以匹配复杂的文本模式,包括字符序列、字符选择、重复模式等。

  • 性能:使用REGEXP可能会影响查询性能,特别是在大型数据集上。优化你的正则表达式和索引(如果可能的话)可以帮助减轻这种影响。
  • 数据库支持:并非所有数据库系统都支持REGEXP或类似的功能。例如,SQL Server 使用 LIKE 和一些扩展的通配符功能,但不直接支持正则表达式。然而,SQL Server 2016及更高版本引入了TRANSLATESTRING_SPLIT等函数,以及CLR集成,可以间接实现正则表达式功能。对于复杂的正则表达式匹配,你可能需要求助于数据库外的处理(如应用程序代码)。
  • 语法差异:不同的数据库系统(如MySQL、PostgreSQL、Oracle等)在REGEXP的语法和支持的正则表达式特性上可能存在差异。因此,在将REGEXP查询从一个数据库迁移到另一个数据库时,需要特别注意。

正则表达式

^:表示一个字符串或行的开头

a-z\]:表示一个字符范围,匹配从 a 到 z 的任何字符。 \[0-9\]:表示一个字符范围,匹配从 0 到 9 的任何字符。 \[a-zA-Z\]:这个变量匹配从 a 到 z 或 A 到 Z 的任何字符。请注意,你可以在方括号内指定的字符范围的数量没有限制,您可以添加想要匹配的其他字符或范围。 \[\^a-z\]:这个变量匹配不在 a 到 z 范围内的任何字符。请注意,字符 \^ 用来否定字符范围,它在方括号内的含义与它的方括号外表示开始的含义不同。 \[a-z\]\*:表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。 \[a-z\]+:表示一个字符范围,匹配从 a 到 z 的任何字符 1 次或多次。 .:匹配任意一个字符。 \\.:表示句点字符。请注意,反斜杠用于转义句点字符,因为句点字符在正则表达式中具有特殊含义。还要注意,在许多语言中,需要转义反斜杠本身,因此需要使用\\\\.。 $:表示一个字符串或行的结尾。 ## 需求 表: `Users` ``` +---------------+---------+ | Column Name | Type | +---------------+---------+ | user_id | int | | name | varchar | | mail | varchar | +---------------+---------+ user_id 是该表的主键(具有唯一值的列)。 该表包含了网站已注册用户的信息。有一些电子邮件是无效的。 ``` 编写一个解决方案,以查找具有有效电子邮件的用户。 一个有效的电子邮件具有前缀名称和域,其中: **前缀** 名称是一个字符串,可以包含字母(大写或小写),数字,下划线 `'_'` ,点 `'.'` 和/或破折号 `'-'` 。前缀名称 **必须** 以字母开头。 **域** 为 `'@leetcode.com'` 。 以任何顺序返回结果表。 结果的格式如以下示例所示: ## 示例 ``` 输入: Users 表: +---------+-----------+-------------------------+ | user_id | name | mail | +---------+-----------+-------------------------+ | 1 | Winston | winston@leetcode.com | | 2 | Jonathan | jonathanisgreat | | 3 | Annabelle | bella-@leetcode.com | | 4 | Sally | sally.come@leetcode.com | | 5 | Marwan | quarz#2020@leetcode.com | | 6 | David | david69@gmail.com | | 7 | Shapiro | .shapo@leetcode.com | +---------+-----------+-------------------------+ 输出: +---------+-----------+-------------------------+ | user_id | name | mail | +---------+-----------+-------------------------+ | 1 | Winston | winston@leetcode.com | | 3 | Annabelle | bella-@leetcode.com | | 4 | Sally | sally.come@leetcode.com | +---------+-----------+-------------------------+ 解释: 用户 2 的电子邮件没有域。 用户 5 的电子邮件带有不允许的 '#' 符号。 用户 6 的电子邮件没有 leetcode 域。 用户 7 的电子邮件以点开头。 ``` ## 分析 > 编写一个解决方案,以查找具有有效电子邮件的用户。 需要查找具有符合要求的电子邮件的用户,输出对应的用户id,用户名和邮箱, > 一个有效的电子邮件具有前缀名称和域,其中: > > **前缀** 名称是一个字符串,可以包含字母(大写或小写),数字,下划线 `'_'` ,点 `'.'` 和/或破折号 `'-'` 。前缀名称 **必须** 以字母开头。 > > **域** 为 `'@leetcode.com'` 。 通过where mail regexp +正则表达式检索 \^:表示一个字符串或行的开头 $:表示一个字符串或行的结尾 要求,前缀名称 **必须** 以字母开头,不限制大小写,所以\^\[a-zA-Z

可以包含字母(大写或小写),数字,下划线 '_' ,点 '.' 和破折号 '-' ,所以^[a-zA-Z]+[a-zA-Z0-9_.-]*,这里面包含小写字母、大写字母、数字、下划线 '_' 、点 '.' 和破折号 '-'。其中[xxx]*表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。

'@leetcode.com'

后缀或者域为'@leetcode.com',需要写作@leetcode\\.com,然后用$结尾

其中\.:表示句点字符。请注意,反斜杠用于转义句点字符,因为句点字符在正则表达式中具有特殊含义。还要注意,在许多语言中,需要转义反斜杠本身,因此需要使用\\.。

最终就是where mail regexp '^[a-zA-Z][a-zA-Z0-9_.-]*@leetcode\\.com$'

代码

复制代码
select *
from Users
where mail regexp '^[a-zA-Z][a-zA-Z0-9_.-]*@leetcode\\.com$'
相关推荐
陈卓4102 分钟前
MySQL-主从复制&分库分表
android·mysql·adb
IT项目管理36 分钟前
达梦数据库DMHS介绍及安装部署
linux·数据库
你都会上树?43 分钟前
MySQL MVCC 详解
数据库·mysql
大春儿的试验田1 小时前
高并发收藏功能设计:Redis异步同步与定时补偿机制详解
java·数据库·redis·学习·缓存
Ein hübscher Kerl.1 小时前
虚拟机上安装 MariaDB 及依赖包
数据库·mariadb
长征coder2 小时前
AWS MySQL 读写分离配置指南
mysql·云计算·aws
醇醛酸醚酮酯2 小时前
Qt项目锻炼——TODO清单(二)
开发语言·数据库·qt
ladymorgana2 小时前
【docker】修改 MySQL 密码后 Navicat 仍能用原密码连接
mysql·adb·docker
PanZonghui2 小时前
Centos项目部署之安装数据库MySQL8
linux·后端·mysql
GreatSQL社区2 小时前
用systemd管理GreatSQL服务详解
数据库·mysql·greatsql