分分钟使用正则表达式

正则表达式简单语法总结

一、什么是正则表达式

        从概念上来说,正则表达式也是一门小巧而精炼的语言,它可以用来简化检索特定的字符串,替换特定字符等功能,有许多开发语言工具,都内嵌支持正则表达式。那么一个正则表达式,究竟是什么?其实它就是一个字符串,但这个字符串具有特定含义。

二、正则表达式的基础语法

1、字面值

所谓字面值,就是没有任何转义,查找的对象就是其本身,比如正则表达式 abc ,查找的结果就是返回要查找字符串中 a,b,c三个字母连在一起的字符串。又如,123 就是查找到123这个子串。

2、特殊字符(元字符)

(1)句号

“.”在正则表达式中表示匹配任意字符,很相似于通配符*。如果我们查找a.b这个正则表达式,我们可以找到所有开头和结尾为a,b,中间是任意字符的字符串,比如abc,adc,a2c等。

(2)字符类([])

如果你在一个正则表达式中看到有一些字符被[]括号括起来,那么他们的含义将不再是简单的字面值,他们表示某一个被括号中属性约束的字符。比如[123456],这个正则表达式表示找到1-6中的任意一个字符,又比如a[bd]c,这表示查找abc或者adc。

注意:

        1.在字符类中字符的顺序和重复性都不是我们关心的。[123]和[2233111],含义是一模一样的。

        2.句号在字符类中表示的就是其本身,[.]就是查找一个句号。

(3)区间符号(-)

如果我们需要查找一个数字,[0123456789],这样做是可以达到目的的,但这写起非常麻烦,并不符合正则表达式小巧的特性,这时我们可以使用区间符号来简化,[0-9]和上面的式子意义完全一样。同样,我们可以[a-zA-Z],表示任意一个字母。

注意:

        1.区间的范围应该有意义,[a-1]这样的区间并无任何意义,尽管它在语法上可能没有错误。

        2.区间左右两端对应的是字符,并不是数字,比如[2-41],这个式子的含义是找到2-4的一个数字或者1,和[1-4]是一样的。

(4)取反符号(^)

“^”在正则表达式中表示取反,这个很好理解,[^a],表示找到除了a之外的任意字符。[^0-9],表示找到一个非数字的字符。

注意:

        1.^必须在中括号内,及字符类属性中使用。

        2.^是将后面的整体作为取反条件的。

(5)简化的字符类

某些符号具有和字符类相同的含义:

\d和[0-9]相同

\w和[0-9A-Za-z_]相同 表示数字,字母或者下划线

\s表示匹配空格,tab和换行等不可见符。

与此相对的\D,\W,\S,则表示上述条件的取反情况。

(6)乘法集({})

乘法集的最大用处也是简化正则表达式,用大括号表示。比如,a{2},表示找到aa这个字符串。

注意:

        乘法集是已前面整体为乘法条件的,比如[ab]{2},不是简单的比配aa,bb,而是和[ab][ab]含义是相同的,会匹配ab,ba,aa,bb。

(7)乘法集中的区间(,)

乘法集和字符类相同,也可以用区间进行简化,但是符号不相同。a{1,3},表示找到a,aa,aaa这三个字符串。a{0,1}是合法的,表示找到空字符,或者a。

注意:

        1.乘法集的"越长越好"属性:乘法集具有这样的特点,比如a{2,4},如果我搜索myaaaa,它不会找到aa后就停止,而是会找到aaaa。

        2.乘法集的"全部获取"属性:比如a{2.4},如果搜索myaayouaaaa,它会找到aa和aaaa。

        3.乘法集支持开区间,a{1,}是合法的,表示找到任何a相连的字符串。

(8)判断符号(?)

这个符号的含义和{0,1}完全相同,123?4,表示匹配1234或者124;

(9)统配符号(*)

这个符号的含义和{0,}相同,比如.* 表示通配一切字符串。

(10)+符号

这个符号和{1,}相同。

(11)或符号(|)

“|”符号表示或的关系,比如abc|edf,表示找到abc或者def

(12)组合(())

小括号在正则表达式中表示组合,比如(a|b|c)d,表示找到ad,bd,cd,可以将小括号的作用理解为优先级。

(13)单词边界(\b)

\b表示单词的边界,比如\b[a-z]{3}\b,表示匹配一个三个字母的小写单词。

(14)行边界(^ $)

单单的一个^符号表示的是行的开头,$表示行的结束。

注意:

        [^]是非法的,[$]表示匹配一个$符号。

三、做些小总结

上面说了这么多正则表达式的语法规则,我们现在来做下总结:

1、几个概念:

1、字面值:直接查找的字符,比如123,avb。

2、字符类:描述字符的一些属性,比如[123],[a-z],\d,\w,\s,.。

3、乘法集:简化表达式,比如{0,3},?,+,*。

4、或和组合:比如(a|b|v)。

5、单词,行的边界\b ^ $

2、元字符列表

. \ [ ] { }  ? * + | ( ) ^ $

3、字符类中元字符列表

[ ] \ - ^

四、一个特别重要的字符

最后,还有一个特别特别重要的字符我们没考虑到,如果我们要查找元字符怎么办,在正则表达式中还有一个转义字符"\",如果我们要查找. 只要查找\. 同理\[\]是查找"[]"这个字符串。如果要查找"\",再加一个转义字符就好:\\。

时间: 2024-09-20 13:10:08

分分钟使用正则表达式的相关文章

python使用正则表达式分析网页中的图片并进行替换的方法

 这篇文章主要介绍了python使用正则表达式分析网页中的图片并进行替换的方法,涉及Python使用正则表达式的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了python使用正则表达式分析网页中的图片并进行替换的方法.分享给大家供大家参考.具体分析如下: 这段代码分析网页中的所有图片表单<img>,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接. 代码如下: result = value.replace("[ page ]","

JAVA正则表达式4种常用功能

正则 正则表达式在字符串处理上有着强大的功能,sun在jdk1.4加入了对它的支持 下面简单的说下它的4种常用功能: 查询: String str="abc efg ABC"; String regEx="a|f"; //表示a或f Pattern p=Pattern.compile(regEx); Matcher m=p.matcher(str); boolean rs=m.find(); 如果str中有regEx,那么rs为true,否则为flase.如果想在查

请问一个正则表达式

问题描述 路过的大侠们,麻烦帮忙支个招(没分了... ):写一个正则表达式:1.字符串不能以空格开头.结尾2.中间不能有字符:<>我写了个正则表达式:/(^[^<>s]$)|(^(?!s)([^<>]+?)([^s])$)/但是,这个表达式有一种情况不能满足,即,以<>结尾,非空格开头,例如:1<对正则表达式不了解,搞了半天没弄出来,麻烦大侠们帮忙弄弄..../////////////////////////////////////////弄好了...

js正则表达式基本知识

 1."."为通配符,表示任何一个字符,例如:"a.c"可以匹配"anc"."abc"."acc": 2."[]",在[]内可以指定要求匹配的字符,例如:"a[nbc]c"可以匹配"anc"."abc"."acc" :但不可以匹配"ancc",a到z可以写成[a-z],0到9可以写成[0-

关于经纬度正则表达式

问题描述 关于经纬度正则表达式 经纬度正则验证表达式 例如:经度120.000000纬度80.000000 经度范围-180.000000-180.000000 纬度:-90.000000-90.0000000 function checkLongitude(){ var longitude = $('#longitude').val(); if(longitude==null||longitude==''){ $('#longitudeMsg').show(); $('#longitudeMs

求助,正则表达式关于扩展名

问题描述 求助,正则表达式关于扩展名 我想检验后缀名为doc;ppt;exe可以输入一个或多个扩展名.多个用";"号隔开.就像我上面写的那样.该怎么写呢? 解决方案 ^[a-zd]+(;[a-zd]+)*$ 解决方案二: 提取扩展名的正则表达式求助正则表达式正则表达式

IOS中用正则表达式判断输入的内容为8-16位且同时包含数字和字母

今天在项目中需要用到判断用户输入的用户名长度为8-16位且同时包含数字和字母,在网上搜了一下正则表达式的用法,然后参考这篇blog,完美解答了问题.记录一下: 密码有如下要求:由数字和字母组成,并且要同时含有数字和字母,且长度要在8-16位之间. 如何分析需求?拆分!这就是软件设计的一般思路了.于是乎,拆分需求如下: 1,不能全部是数字 2,不能全部是字母 3,必须是数字或字母 只要能同时满足上面3个要求就可以了,写出来如下: 1 ^(?![0-9]+$)(?![a-zA-Z]+$)[0-9A-

常见正则表达式汇总【一】

1.  匹配行的起始和结束: Ip as-path access-list 20 permit 850 该过滤器匹配任何包含字符串 850 的 as-path .匹配的 as-path 例如:( 850 ),( 23 , 5 , 850 , 155 )和( 1123 , 850 , 367 )等等.无论所匹配的串是属性中唯一的串或者属性中多个 AS 号中的一个甚至是属性中一个很大的 AS 号中的一部分,该匹配都成功. Ip as-path access-list 20 permit ^850$

求正则表达式一枚,不胜感谢

问题描述 求正则表达式一枚,不胜感谢 给一字符串,检测其同时包含<和>符号,不胜感谢,求指点,java的 解决方案 直接查找两个字符好了. 解决方案二: Pattern pattern = Pattern.compile("(<.+>)|(>.+<)"); Matcher matcher = pattern.matcher("字符串"); if (matcher.matches()) { ... } 解决方案三: <,*?&