vlambda博客
学习文章列表

MySQL中的通配符与正则表达式

查询"李"姓老师的数量

select count(t_id) from te where t_name like '李%';

为在搜索子句中使用通配符,必须使用LIKE操作符。LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。

通配符(wildcard) 用来匹配值的一部分的特殊字符。

百分号(%)通配符

最常使用的通配符是百分号(% )。在搜索串中,% 表示任何字符出现任意次数。

上面的例子使用了搜索模式'李%',在执行这条子句时,将检索任意以起头的词。% 告诉MySQL接受 之后的任意字符,不管它有多少字符。

通配符可在搜索模式中任意位置使用,并且可以使用多个通配符。

下面的例子使用两个通配符,它们位于模式的两端:

查询名字中含有"风"字的学生信息

select *
from stu
where s_name like '%风%';

结果

s_id s_name s_birth s_sex
03 孙风 1990-05-20

搜索模式'%风%' 表示匹配任何位置包含文本"风"的值,而不论它之前或之后出现什么字符。

下划线(_)通配符

下划线_的用途与% 一样,但下划线只匹配单个字符而不是多个字符。

% 能匹配0个字符不一样,_ 总是匹配一个字符,不能多也不能少。

查询姓名中第二个字符为a的员工信息

select * from emp where ename like '_a%';

结果

empno ename job mgr hiretime sal comm deptno
7521 WARD SALESMAN 7698 1981-02-22 1250 500 30
7654 MARTIN SALESMAN 7698 1981-09-28 1250 1400 30
7900 JAMES CLERK 7698 1981-12-03 950
30
使用通配符的技巧

正如所见,MySQL的通配符很有用。但这种功能是有代价的:通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一些使用通配符要记住的技巧。

  • 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符。
  • 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
  • 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。

总之,通配符是一种极重要和有用的搜索工具,以后我们经常会用到它。


前面两章通过通配操作符寻找数据,但随着过滤条件的复杂性的增加,WHERE子句本身的复杂性也有必要增加。

正则表达式是用来匹配文本的特殊的串(字符集合)。

使用MySQL正则表达式

正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用WHERE 子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤SELECT 检索出的数据。

MySQL正则表达式是在REGEXP后跟正则表达式。

select *
from emp
where hiretime REGEXP '12';

结果

empno ename job mgr hiretime sal comm deptno
7369 SMITH CLERK 7902 1980-12-17 800
20
7900 JAMES CLERK 7698 1981-12-03 950
30
7902 FORD ANALYST 7566 1981-12-03 3000
20

LIKEREGEXPLIKEREGEXP 之间有一个重要的差别。

LIKE 匹配整个列。如果被匹配的文本在列值中出现,LIKE 将不会找到它,相应的行也不被返回(除非使用通配符)。而REGEXP 在列值内进行匹配,如果被匹配的文本在列值中出现,REGEXP 将会找到它,相应的行将被返回。这是一个非常重要的差别。

使用^$ 定位符可使得REGEXP 用来匹配整个列值。


MySQL中的正则表达式匹配不区分大小写。为区分大小写,可在REGEXP后使用BINARY 关键字。

正则表达式用正则表达式语言来建立,正则表达式语言是用来完成刚讨论的所有工作以及更多工作的一种特殊语言。MySQL中的正则表达式的规则与Python中基本一致,这里可以参考。本文将不做过多介绍。

推荐阅读

-- 数据STUDIO --