注意:大小写的区别,大写是取反的意思。
\d: 任意一个数字,0~9中的任意一个
\w: 任意一个字母或数字或下划线,也就是AZ,az,0~9,_中的任意一个
\s: 包括空格、制表符、换行符等空白字符的其中任意一个
. : 匹配任意字符(除了换行符),如果一般要匹配包括"\n"在内的所有字符,一般用[\s\S]
-[]方括号匹配方式,能够匹配方括号中的任意一个字符
[ab5@] :匹配"a",“b”,5,@中的任意一个字符 [^abc]: 匹配"a",“b”,"c"之外的任意一个字符,^表示取反的意思
[f-k]: 匹配"f"~"k"之间的任意一个字符
[^A-F0-3]: 匹配"A"“F”,"0""3"的任意一个字符,
现在:[\d.\-+]:中的.就代表是真正的.因为包括在[],除了^-,已经不具有特殊意义了,要想使用加转义字符
[\s\S]:表示全部字符包括\n,\s所有空白字符,\S取反,在取或,全部字符包括换行符了
{m}:重复m次 eg:\d{m} ,\d\d{m} ,{\d,\d}{m}
{m,n}:最少m次,最多n次
{m,}:表达式至少重复m次
贪婪模式:就是匹配量词每次以最大的去匹配,如{1,2},每次匹配2个,在去匹配下一个还是匹配2个
非贪婪模式:和贪婪模式相反
注意:这里的贪婪模式和非贪婪模式是指在量词后面添加?,不要与下面的弄混肴了
特别重要:重要的东西看三次:?0-1次,+最少1次,*0~多次
?:0-1次
+:表达式至少1次,
*:0-多次
-(本组标记匹配的不是字符,而是一个位置,符合某种条件的位置),零宽,不是某一个字符,而是一个位置
^ 与字符串开始的位置匹配
$ 与字符串结束的位置匹配
\b 匹配一个单词的边界:-b左右两边不全是用\w表示,即有一边不能用单词来表示呗,多容易理解
.IGNORECASE 忽略大小写模式:默认不忽略大小写
.SINGLELINE 单行模式:整个文本看做是一个字符串,只有一个开头,一个结尾
.MULTILINE 多行模式:每行都是一个字符串,都有开头和结尾,如果指定多行后还想像单行模式那样匹配^和$,用\A和\Z来表示(很容易理解嘛,A开始,Z结束)
选则符和分组
表达式作用分支结构|或的关系,匹配左边或右边()捕获组在修饰匹配次数的时候,括号中的表达式可以做为整体被修饰,根据(来排序,\1,\2,\3来表示出现的次数(?:Expression)使用?:就可以使用捕获组的结构,但是又不保存()中的内容到内存,取出占用内存资源eg:([a-z]{2})\1 abab (捕获) aabb(补捕获)
(?:[a-z]{2})\1,只使用格式但不捕获
后端断言和前端断言
记住:弄明白,其实不难
前端断言从最后端开始检测,后端断言从最前端开始检测,所谓断言不就是你自己写的表达式吗?(恍然大悟)
[a-z]+(?=ing) 匹配出现ing结尾的但不包括ing的1~多个单词
(?<=ing)[a-z] 从最左端匹配,断言的前面能出现表达式ing
实际操作:
固定电话和11位手机号:
以0开头,前面是2~3位,后面是7,8位
(0\d{2,3}-\d{7,8})|(1[35789]\{9})
电子邮箱验证:
[\w\-]+[0-9a-zA-Z]+(\.[a-zA-Z]{2,3}){1,2}
进入整体:我复习正则就是之前学的模棱两可,下面讲一下正则表达式在java中的使用:
java.util.regex包下有两个类Pattern和Matcher
注意:在java中,每次遇到正则的斜杠就多加一个\
Pattern p=Pattern.complier("\\\\w{2,4}"); Matcher matcher=p.matcher("_234"); System.out.println(matcher.matches());关于Matcher.find()和Matcher.group(),find是子字符串匹配也返回true,group()返回匹配的分组:
Pattern pattern=Pattern.compile("([a-z]+)([0-9]+)"); Matcher matcher=pattern.matcher("_aaa2324"); // System.out.println(matcher.matches()); while(matcher.find()) { System.out.println(matcher.group(1)); System.out.println(matcher.group(2)); } }字符串的替换
Pattern p=Pattern.complie("\\d+"); Matcher matcher=pattern.matcher("lcy23hha222"); String newStr=matcher.replaceAll("#"); System.out.println(newStr);字符串的切割
String s="a23b232c32"; String [] splitChar=s.split("\\w+"); System.out.println(Arrays.toString(splitChar));