正则表达式的个人理解与学习

科技2022-07-11 171

注意：大小写的区别，大写是取反的意思。

\d: 任意一个数字，0~9中的任意一个

\w: 任意一个字母或数字或下划线，也就是A_Z,az,0~9,_中的任意一个

\s: 包括空格、制表符、换行符等空白字符的其中任意一个

. ：匹配任意字符（除了换行符），如果一般要匹配包括"\n"在内的所有字符，一般用[\s\S]

自定义字符集合:

-[]方括号匹配方式，能够匹配方括号中的任意一个字符

[ab5@] :匹配"a",“b”,5,@中的任意一个字符 [^abc]: 匹配"a",“b”,"c"之外的任意一个字符,^表示取反的意思

[f-k]: 匹配"f"~"k"之间的任意一个字符

[^A-F0-3]: 匹配"A"_“F”,"0""3"的任意一个字符，

现在：[\d.\-+]:中的.就代表是真正的.因为包括在[]，除了^-，已经不具有特殊意义了，要想使用加转义字符

[\s\S]:表示全部字符包括\n,\s所有空白字符，\S取反，在取或，全部字符包括换行符了

量词(Quantifier)

{m}:重复m次 eg:\d{m} ,\d\d{m} ,{\d,\d}{m}

{m,n}:最少m次，最多n次

{m,}:表达式至少重复m次

贪婪模式：就是匹配量词每次以最大的去匹配，如{1,2},每次匹配2个，在去匹配下一个还是匹配2个

非贪婪模式：和贪婪模式相反

注意：这里的贪婪模式和非贪婪模式是指在量词后面添加?，不要与下面的弄混肴了

特别重要：重要的东西看三次：?0-1次，+最少1次,*0~多次

?:0-1次

+:表达式至少1次，

*:0-多次

字符边界

-（本组标记匹配的不是字符，而是一个位置，符合某种条件的位置），零宽，不是某一个字符，而是一个位置

^ 与字符串开始的位置匹配

$ 与字符串结束的位置匹配

\b 匹配一个单词的边界：-b左右两边不全是用\w表示，即有一边不能用单词来表示呗，多容易理解

正则表达式的匹配模式

.IGNORECASE 忽略大小写模式:默认不忽略大小写

.SINGLELINE 单行模式：整个文本看做是一个字符串，只有一个开头，一个结尾

.MULTILINE 多行模式：每行都是一个字符串，都有开头和结尾，如果指定多行后还想像单行模式那样匹配^和$，用\A和\Z来表示（很容易理解嘛，A开始，Z结束）

捕获组和非捕获组

选则符和分组

表达式作用分支结构|或的关系，匹配左边或右边()捕获组在修饰匹配次数的时候，括号中的表达式可以做为整体被修饰，根据(来排序，\1,\2,\3来表示出现的次数(?:Expression)使用?:就可以使用捕获组的结构，但是又不保存()中的内容到内存，取出占用内存资源

eg:([a-z]{2})\1 abab (捕获) aabb(补捕获)

(?:[a-z]{2})\1，只使用格式但不捕获

零宽断言

(?=expression)断言出现的位置的后面能匹配表达式exp(?<=expression)断言自身出现的位置的前面能匹配表达式exp(?!exp)断言此位置的后面不能匹配表达式exp(?<!exp)断言此位置的前面不能匹配表达式exp

后端断言和前端断言

记住：弄明白，其实不难

前端断言从最后端开始检测，后端断言从最前端开始检测，所谓断言不就是你自己写的表达式吗？（恍然大悟）

[a-z]+(?=ing) 匹配出现ing结尾的但不包括ing的1~多个单词

(?<=ing)[a-z] 从最左端匹配，断言的前面能出现表达式ing

实际操作：

固定电话和11位手机号：

以0开头，前面是2~3位，后面是7,8位

(0\d{2,3}-\d{7,8})|(1[35789]\{9})

电子邮箱验证：

[\w\-]+[0-9a-zA-Z]+(\.[a-zA-Z]{2,3}){1,2}

进入整体：我复习正则就是之前学的模棱两可，下面讲一下正则表达式在java中的使用：

java.util.regex包下有两个类Pattern和Matcher

注意：在java中，每次遇到正则的斜杠就多加一个\

Pattern p=Pattern.complier("\\\\w{2,4}"); Matcher matcher=p.matcher("_234"); System.out.println(matcher.matches());

关于Matcher.find()和Matcher.group()，find是子字符串匹配也返回true,group()返回匹配的分组：

Pattern pattern=Pattern.compile("([a-z]+)([0-9]+)"); Matcher matcher=pattern.matcher("_aaa2324"); // System.out.println(matcher.matches()); while(matcher.find()) { System.out.println(matcher.group(1)); System.out.println(matcher.group(2)); } }

字符串的替换

Pattern p=Pattern.complie("\\d+"); Matcher matcher=pattern.matcher("lcy23hha222"); String newStr=matcher.replaceAll("#"); System.out.println(newStr);

字符串的切割

String s="a23b232c32"; String [] splitChar=s.split("\\w+"); System.out.println(Arrays.toString(splitChar));

Processed: 0.011, SQL: 9