2020博客之星年度总评选进行中:请为74号的狗子投上宝贵的一票! 我的投票地址:点击为我投票
在许多场景中,我们需要验证用户输入的数据是否有效,或者是查找并修改文本,或者是提取指定数据,为此,相对于Qstring的一些函数,QT提供了一个更加强大的类——QRegExp,使用函数配合正则表达式来操作字符串,QRegExp可以进行下面的操作,并附带检验小程序,可在文末下载。
matchedLength() 匹配的长度
capturedTexts() 捕捉到的字符串列表, 对应的还有captureCount() ,获取表达式中含有的捕捉组的数目
cap(int n) 第n个组的内容(0代表匹配自身)
cap()参数缺省值为0。cap(0):表示匹配的整个文本的值。cap(1):表示第1个圆括弧中的值。cap(2):表示第2个圆括弧中的值。pos(int n) 第n个组的位置(默认值为0)
QRegExp::indexIn() 搜索字符串以找到匹配的字串,返回索引值,失败返回-1
QRegExp::lastIndexIn() 同上,只是从后向前搜索
QString str = "(.*)=(.*)"; QRegExp rx_1(str); QString str_1 = ("a=100"); int pos = rx_1.indexIn(str_1); if(pos>=0) { qDebug()<<rx_1.matchedLength(); //5 qDebug()<<rx_1.capturedTexts(); //("a=100", "a", "100") qDebug()<<rx_1.cap(0);//"a=100" qDebug()<<rx_1.cap(1);//"a" qDebug()<<rx_1.cap(2);//"100" qDebug()<<rx_1.pos(0);//0 qDebug()<<rx_1.pos(1);//0 qDebug()<<rx_1.pos(2);//2 }(?:pattern)是非捕获型括号 匹配pattern,但不捕获匹配结果 (pattern)是捕获型括号。 匹配pattern,匹配pattern并捕获结果,自动获取组号 (?<name> pattern ) 匹配pattern, 匹配pattern并捕获结果,设置name为组名 例如,将(.*)=(.*)改为(?:.*)=(.*),qDebug()<<rx_1.cap(1);该值将为100,而 qDebug()<<rx_1.cap(2);将为空。
将匹配到的字符串替换成其他字符串,例如将文本中的a=100修改为b=100
QString str = "a=100"; s.replace(QRegExp("(.*)="),"b=");将匹配到的字符串内容进行自定义或替换,例如将文本中的a=100修改为100=a
Qstring str = "a=100"; s.replace(QRegExp("(.*)=(.*)"),"\\2=\\1");// \\1就是相当于cap(1),表示第1个圆括弧中的值。这里用到QRegExp::exactMatch来判断输入的字符是否符合正则表达式。
QRegExp::exactMatch() 判断字符串是否完全(从头到尾)匹配,返回真或假
QRegExp rx("\\d"); //正则表达式 bool match = rx.exactMatch("8");//验证文本 if(match == true) { //表达式正确 return; } //表达式错误对此,QRegExp都有相对应的函数方法,还有一些函数上面没有写出来,例如:
isValid();//判断正则表达式是否合法,合法返回true,否则返回false。 pattern();//获得正则本身
其他完整函数,大家可在文末点击官方文档查阅,当然,所有的函数方法都离不开一个核心就是正则表达式,我们来看下。
正则表达式是由表达式+量词+断言组成。
首先是表达式:
例子含义c除非具有特殊的正则表达式含义(., ^, $, [, ], * , +, ? ),否则字符表示自身。例如c匹配字符c\c除以下指定的字符外,反斜杠后面的字符与字符本身匹配。例如,要匹配字符串开头的文字插入符,请写\ ^\a匹配ASCII铃声(BEL,0x07)\f匹配ASCII换页(FF,0x0C)\n匹配ASCII换行符(LF,0x0A,Unix换行符)\r匹配ASCII回车(CR,0x0D)\t与ASCII水平制表符(HT,0x09)匹配\v匹配ASCII垂直制表符(VT,0x0B)。.(dot)匹配任何字符(包括换行符)\d匹配一个数字\D匹配一个非数字。\s匹配一个空白字符\S匹配非空格字符。\w任意单字字符(字母,数字或者下划线)\W任意非单字字符\n第n个反向引用,例如\ 1,\ 2等。注意: C ++编译器将反斜杠转换为字符串。要将\包含在正则表达式中,请输入两次,即\\。要匹配反斜杠字符本身,请输入四次,即\\\\。
最简单的一个正则表达式就是字符,例如:
a 匹配字符ab 匹配字符b9 匹配数字9表达式后面可以加量词,默认情况下,表达式会自动由{1,1}进行量化,即它应该只出现一次。在下面的列表中,E代表表达。表达式是一个字符,或者是一组字符的缩写,或者在方括号中是一组字符,或者在括号中是表达式。
例子解释E??代表0个或1个E**代表0个或1个或多个E++代表1个或多个E{3}匹配3次E{3,}匹配大于等于3次E{,6}匹配至多m次,等价于a{0,m}E{3,6}匹配至少3次,至多6次(包括3和6)例如:
E?匹配0次或者1次EE+ 匹配1次或者多次EE{3,6} 匹配至少3次,至多6次E可以在表达式和量词的基础,加入断言,进行一些限制,例如我们想要匹配0-9,我们可以将正则表达式写为/d,如果我们想要匹配0-99,我们可以写成[0-9]{1,2},这时,字符串“89”符合,字符串“我们今年21岁了”也符合,因为里面有21,单独使用[0-9]{1,2},它会匹配包括出现在字符串中间的整数,如果想匹配的整数是整个字符串,那么就需要使用断言“^”和“$”了。 断言在正则表达式中出现的位置对文本进行一些声明,但不匹配任何字符。在以下列表中,E代表任何表达式。
例子解释^尖号表示字符串的开头。如果您想匹配文字,则必须通过书写将其转义\。例如,^#include将仅匹配以字符’#include’开头的字符串。(当插入号是字符集的第一个字符时,它具有特殊含义,请参见字符集。)$美元表示字符串的结尾。例如,\ d \ s * 将 匹 配 以 数 字 结 尾 ( 可 选 ) 后 跟 空 格 的 字 符 串 。 如 果 您 想 匹 配 文 字 将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字 将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字,则必须通过书写将其转义\$。\b单词边界。例如,正则表达式\ bOK \ b表示在单词边界(例如字符串或空白的开头)之后立即匹配字母“ O”,然后紧接在另一个单词边界(例如字符串或空白的结尾)之前匹配字母“ K”。但是请注意,该断言实际上并不与任何空格匹配,因此如果我们编写(\ bOK \ b)并且具有匹配项,即使该字符串为“ It’s OK now”,它也将仅包含“ OK ”。\B非单词边界。只要\ b为假,该断言就为真。例如,如果我们在“ Left on”中搜索\ Bon \ B,则匹配将失败(字符串的空格和结尾不是非单词边界),但将在“ t on ne”中匹配。(?= E)如果表达式此时在regexp中匹配,则此断言为true。(?!E)如果此表达式在regexp中不匹配,则此断言为true。除此之外,还有其他一些其他字符可以和表达式组合,方括号表示匹配方括号中包含的任何字符。上述字符集缩写可以出现在方括号中的字符集中。除字符集缩写和以下两个例外外,字符在方括号中没有特殊含义。
例子含义^如果字符集作为第一个字符出现(即紧接在方括号之后),则插入符将否定该字符集。[ABC]匹配’a’或’b’或’c’的,但[^ ABC]匹配任何但’a’或’b’或’c’的。-破折号表示字符范围。[W-Z]与“ W”或“ X”或“ Y”或“ Z”匹配。通配符匹配,大多数命令外壳(如bash或cmd.exe)都支持“文件通配”,即使用通配符标识一组文件的能力。所述setPatternSyntax()函数用于正则表达式和通配符模式之间切换。通配符匹配比完整的正则表达式简单得多,并且只有四个功能:
例子解释c除了下面提到的那些字符以外,任何字符都代表自己。因此,c与字符c相匹配。?匹配任何单个字符。与相同。在完整的正则表达式中。*匹配零个或多个任何字符。与完整正则表达式中的。*相同。[…]字符集可以用方括号表示,类似于完整的正则表达式。在字符类中,与外部一样,反斜杠没有特殊含义。其他一些组合
例子解释[abc]方括号中间是几个字母,表示a,b,c这三个单独的字符^abc除了a,b,c以外的字符[a-z]匹配a到z之间(包括a和z)的所有单个字符[a-zA-Z]a到z,A到Z的所有单个字符(a|b)a或b很多人找不到相对应的文档,这里大家可以注意下,例如我是qt5的,那么只需要doc.qt.io/qt-5/xxxxxxx.html,这里xxxxxxx只需要写对应的类名即可找到对应类的文档,QRegExp类使用正则表达式提供模式匹配。
我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1f5f69uzg8o23
花狗Fdog 认证博客专家 Qt C C 我是一名程序员,在这条没有鲜花与掌声的路上,我依然选择了坚守,坚守下去,坚守一生。