搜索
您的当前位置:首页正文

在SQL中使用正则表达式

2023-08-02 来源:保捱科技网
在SQL中使⽤正则表达式

  科研管理数据库中由于后台代码中关于项⽬查看的部分出现bug,导致数据库中学科代码如7403510变成了7403510语⾔教学,现在要修复这些问题数据,⾸先需要在数据库中检索出所有的问题数据,在⽹上搜索有关Oracle中在SQL语句中使⽤正则表达式的知识。  起初,我想⽤ select c_project_name,c_year, c_discipline from t_general where not regexp_like(c_discipline,'[0-9]') and c_year ='2014';来检索出除学科代码全由数字组成的数据之外的所有数据,但是发现不⾏,具体原因有待考察。

  换⼀种思路,检索出除学科代码全由数字结尾的数据之外的所有数据,select c_project_name,c_year, c_discipline from t_generalwhere not regexp_like(c_discipline,'[0-9]$') and c_year = '2014';得到我想要的结果:

(转载)

当我们要进⾏⼀些简单的糊涂查询时⽤百分号(%),通配符(_)就可以了.其中%表达任意长度的字符串,_表⽰任意的某⼀个字符.⽐如select * from emp where ename like 's%' or ename like 's_';

但如果在⼀些复杂的查询中关⽤这两个符号sql语句就会⾮常复杂,⽽且也不⼀定能实现.从Oracle 10g开始引⼊了在其他程序语⾔中普通使⽤的正则表达式.

主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数.

正则表达式中的元字符:

元字符 \\

^ $ *

+{n}

意思

\\n 匹配换⾏符

说明要匹配的字符是⼀个特殊字符、常

\\\\ 匹配 \\

量或者后者引⽤。(后引⽤重复上⼀次

\\( 匹配 (

的匹配)

\\) 匹配 )匹配字符串的开头位置匹配字符串的末尾位置匹配前⾯的字符0次或多次匹配前⾯的字符1次或多次匹配前⾯的字符0次或1次

^a匹配arwen.但不匹配barwen.en$匹配arwen.但不匹配arwenb.a*rwen可以匹配rwen或aaarwen.

a+rwen可以匹配arwen或aarwen.但不能匹配rwen.

a?rwen可以匹配arwen或rwen.但不能匹配aarwen.

例⼦

匹配前⾯的字符恰好是n次,其中n是整ar{2}wen可以匹配arrwen.但不能匹配arwen或数arrrwen.匹配前⾯的字符⾄少是n次,最多是m次.如果写成

{n,}表⽰最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.

{n,m}

.

点号,匹配除null,换⾏以外的任意单个字arw.n.可以匹配arwen,arwin.但不能匹配arween符或arwn.

其实括号就像⼀般语⾔表达式中的括号.有时多括号中pattern是⼀个⼦正则表达式,匹

(pattern)加些括号可增强可读性.另外的⽤处见下⾯关于

配指定pattern模式的⼀个⼦表达式。

\\n的描述.x|y[abc][a-z]

匹配“或”

可以匹配abc中的任何单个字符可以匹配指定范围内的任何单个字符

x|y可以匹配x或者y

hello[abc]可以匹配helloa,hellob,hellochell[a-z]可以匹配hello或者hellz

[:alphanum:]可以匹配字符0-9、A-Z、a-z[:alpha:]可以匹配字符A-Z、a-z[:blank:]可以匹配空格或tab键[:digit:]可以匹配数字0-9

[::]

[:graph:]可以匹配⾮空字符

指定⼀个字符类,可以匹配该类中的任[:lower:]可以匹配⼩写字母a-z何字符[:print:]与[:graph:]类似,不同之处在于[:print:]包

括空格字符

[:punct:]可以匹配标点符号.,\"\"等等[:space:]可以匹配所有的空字符

[:space:]可以匹配所有的空字符[:upper:]可以匹配⼤写字母A-Z

[:xdigit:]可以匹配⼗六进制数字0-9、A-F、a-f

\\n

这是对前⼀次匹配命中的⼀个后引⽤,arw(en)\\1可以匹配arwenen.注意\\1前⾯必须是其中n是⼀个正整数个加括号的⼦表达式.

1.regexp_like:

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供⼀个可选的参数match_option字符串说明默认的匹配选

项。match_option的取值如下:

‘c’ 说明在进⾏匹配时区分⼤⼩写(缺省值); 'i' 说明在进⾏匹配时不区分⼤⼩写;

'n' (.)点号能表⽰所有单个字符,包括换⾏(俺还不知道什么地⽅有⽤到换⾏.只知道sql⾥⾯可以⽤chr(10)表⽰换⾏. 'm' 字符串存在换⾏的时候当作多⾏处理.这样$就可匹配每⾏的结尾.不然的话$只匹配字符串最后的位置.

⽰例:select * from emp where regexp_like(ename,'^a[a-z]*n$');可以查找ename中以a开头以n结尾的⾏.例如ename为arwen或arwin 或anden.但Arwen不能被匹配.因为默认是区分⼤⼩写.如果是select * from emp where regexp_like(ename,'^a[a-z]*n$','i')则可以查找ename为Arwen的⾏记录.

2.regexp_instr:

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])⽤于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关: 'start' 开始查找的位置;

'occurrence' 说明应该返回第⼏次出现pattern的位置;

'return_option' 说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的⼀个字符的位置;若该参数为⾮0的整数,则说明要返回的整数为x中出现在pattern之后 的字符的位置;

'match_option' 修改默认的匹配设置.与regexp_like⾥⾯的相同.⽰例:DECLARE

V_RESULT INTEGER ; BEGIN

SELECT REGEXP_INSTR('hello world','o',1,1,0) INTO V_RESULT FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT); END;

结果为5.即字母o第⼀个次出现的位置

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数.⽐如1,3.则结果为6.表⽰第⼀次出现字母o的后⾯⼀个字符的位置.如果regexp_instr('hello world','o',1,2,0)则结果为9.表⽰第⼆次出现字母o的位置.我做的实验及总结

SELECT REGEXP_INSTR('hello world','o',6,2,1) from dual;其中:

6:开始查找的位置(初始位置为1)1:返回第⼀次出现o的地⽅

1:该参数为⾮0的整数,则说明要返回的整数为o中出现在pattern之后的字符的位置(为9),为0是结果是8;

3.regexp_replace:

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])⽤于在x中查找pattern,并将其替换为replae_string。可

以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数⽰例:DECLARE

V_RESULT varchar2(90); BEGIN

SELECT REGEXP_REPLACE('hello world','o','x',1,1) INTO V_RESULT FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT); END;

结果为hellx world.

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.如果 REGEXP_REPLACE('hello world','o','x',1,2)则结果为hello wxrld.我做的实验及总结

SELECT REGEXP_REPLACE('hello world','o','x',6,1) from dual;6:从第六个开始查找(初始位置为1)1:第⼀次出现o

与REGEXP_INSTR相⽐,少了return_option(0和⾮0的选项)

4.regexp_substr:

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])⽤于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.例如:

DECLARE

V_RESULT VARCHAR2(255); BEGIN

SELECT REGEXP_SUBSTR('hello world','l{2}') INTO V_RESULT FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT); END ; 结果为ll

查询到匹配的字符串才返回匹配的字符.没查到就返回空.

因篇幅问题不能全部显示,请点此查看更多更全内容

Top