正则表达式的个人理解与学习

    科技2022-07-11  74

    注意:大小写的区别,大写是取反的意思。

    \d: 任意一个数字,0~9中的任意一个

    \w: 任意一个字母或数字或下划线,也就是AZ,az,0~9,_中的任意一个

    \s: 包括空格、制表符、换行符等空白字符的其中任意一个

    . : 匹配任意字符(除了换行符),如果一般要匹配包括"\n"在内的所有字符,一般用[\s\S]

    自定义字符集合:

    -[]方括号匹配方式,能够匹配方括号中的任意一个字符

    [ab5@] :匹配"a",“b”,5,@中的任意一个字符 [^abc]: 匹配"a",“b”,"c"之外的任意一个字符,^表示取反的意思

    [f-k]: 匹配"f"~"k"之间的任意一个字符

    [^A-F0-3]: 匹配"A"“F”,"0""3"的任意一个字符,

    现在:[\d.\-+]:中的.就代表是真正的.因为包括在[],除了^-,已经不具有特殊意义了,要想使用加转义字符

    [\s\S]:表示全部字符包括\n,\s所有空白字符,\S取反,在取或,全部字符包括换行符了

    量词(Quantifier)

    {m}:重复m次 eg:\d{m} ,\d\d{m} ,{\d,\d}{m}

    {m,n}:最少m次,最多n次

    {m,}:表达式至少重复m次

    贪婪模式:就是匹配量词每次以最大的去匹配,如{1,2},每次匹配2个,在去匹配下一个还是匹配2个

    非贪婪模式:和贪婪模式相反

    注意:这里的贪婪模式和非贪婪模式是指在量词后面添加?,不要与下面的弄混肴了

    特别重要:重要的东西看三次:?0-1次,+最少1次,*0~多次

    ?:0-1次

    +:表达式至少1次,

    *:0-多次

    字符边界

    -(本组标记匹配的不是字符,而是一个位置,符合某种条件的位置),零宽,不是某一个字符,而是一个位置

    ^ 与字符串开始的位置匹配

    $ 与字符串结束的位置匹配

    \b 匹配一个单词的边界:-b左右两边不全是用\w表示,即有一边不能用单词来表示呗,多容易理解

    正则表达式的匹配模式

    .IGNORECASE 忽略大小写模式:默认不忽略大小写

    .SINGLELINE 单行模式:整个文本看做是一个字符串,只有一个开头,一个结尾

    .MULTILINE 多行模式:每行都是一个字符串,都有开头和结尾,如果指定多行后还想像单行模式那样匹配^和$,用\A和\Z来表示(很容易理解嘛,A开始,Z结束)

    捕获组和非捕获组

    选则符和分组

    表达式作用分支结构|或的关系,匹配左边或右边()捕获组在修饰匹配次数的时候,括号中的表达式可以做为整体被修饰,根据(来排序,\1,\2,\3来表示出现的次数(?:Expression)使用?:就可以使用捕获组的结构,但是又不保存()中的内容到内存,取出占用内存资源

    eg:([a-z]{2})\1 abab (捕获) aabb(补捕获)

    ​ (?:[a-z]{2})\1,只使用格式但不捕获

    零宽断言
    (?=expression)断言出现的位置的后面能匹配表达式exp(?<=expression)断言自身出现的位置的前面能匹配表达式exp(?!exp)断言此位置的后面不能匹配表达式exp(?<!exp)断言此位置的前面不能匹配表达式exp

    后端断言和前端断言

    记住:弄明白,其实不难

    前端断言从最后端开始检测,后端断言从最前端开始检测,所谓断言不就是你自己写的表达式吗?(恍然大悟)

    [a-z]+(?=ing) 匹配出现ing结尾的但不包括ing的1~多个单词

    (?<=ing)[a-z] 从最左端匹配,断言的前面能出现表达式ing

    实际操作:

    固定电话和11位手机号:

    以0开头,前面是2~3位,后面是7,8位

    (0\d{2,3}-\d{7,8})|(1[35789]\{9})

    电子邮箱验证:

    [\w\-]+[0-9a-zA-Z]+(\.[a-zA-Z]{2,3}){1,2}

    进入整体:我复习正则就是之前学的模棱两可,下面讲一下正则表达式在java中的使用:

    java.util.regex包下有两个类Pattern和Matcher

    注意:在java中,每次遇到正则的斜杠就多加一个\

    Pattern p=Pattern.complier("\\\\w{2,4}"); Matcher matcher=p.matcher("_234"); System.out.println(matcher.matches());

    关于Matcher.find()和Matcher.group(),find是子字符串匹配也返回true,group()返回匹配的分组:

    Pattern pattern=Pattern.compile("([a-z]+)([0-9]+)"); Matcher matcher=pattern.matcher("_aaa2324"); // System.out.println(matcher.matches()); while(matcher.find()) { System.out.println(matcher.group(1)); System.out.println(matcher.group(2)); } }

    字符串的替换

    Pattern p=Pattern.complie("\\d+"); Matcher matcher=pattern.matcher("lcy23hha222"); String newStr=matcher.replaceAll("#"); System.out.println(newStr);

    字符串的切割

    String s="a23b232c32"; String [] splitChar=s.split("\\w+"); System.out.println(Arrays.toString(splitChar));
    Processed: 0.068, SQL: 8