浅谈正则表达式(Regular Expression)_正则表达式

一、什么是正则表达式?

简单的说:正则表达式(Regular Expression)是一种处理字符串匹配的语言;

正则表达式描述了一种字符串匹配的模式,可以用来检查一个字符串是否含有某种子串,对匹配到的子串进行“取出”或“替换”操作。

二、正则表达式的应用

正则表达式在实际的开发过程中非常实用,能够快速解决一些复杂的字符串处理问题,下面我对正则表达式的应用做一些简单分类:

第一种:数据验证
比如,你要验证一个字符串是否是正确的EMail,Telphone,Ip等等,那么采用正则表达式就好非常方便。

第二种:内容查找
比如,你要抓取一个网页的图片,那么你肯定要找到<img>标签,这时候用正则表达式就可以精准的匹配到。

第三种:内容替换
比如,你要把手机号码中间四位隐藏掉变成这种模式,123****4567,那么采用正则表达式也会非常方便。

三、正则表达式有哪些内容

下面我将简单的介绍一下正则表达式:

1、 正则表达式的几个重要的概念
•子表达式:在正则表达式中,如果使用"()"括起来的内容,称之为“子表达式”
•捕获:子表达式匹配到的结果会被系统放在缓冲区中,这个过程,我们称之为“捕获”
•反向引用:我们使用"\n",其中n是数字,表示引用之前某个缓冲区之间的内容,我们称之为“反向引用”
2、数量限定符
•X+     表示:1或多个
•X*     表示:0或多个
•X?     表示:0或1个
•X{n}    表示: n个
•X{n,}    表示:至少n个
•X{n,m}   表示:n至m个,贪婪原则,会尽可能匹配多个;如果在后面加个?,则为非贪婪原则
注:X表示要查找的字符

3、 字符限定符
•\d   表示:匹配一个数字字符,[0-9]
•\D  表示:匹配一个非数字字符,[^0-9]
•\w  表示:匹配包括下划线在内的单词字符,[0-9a-zA-Z_]
•\W  表示:匹配任何非单词字符,[^0-9a-zA-Z_]
•\s  表示:匹配任何空白字符,空格、回车、制表符
•\S  表示:匹配任何非空白字符
•.    表示:匹配任何单个字符
此外还有以下几种:

范围字符:[a-z]、[A-Z]、[0-9]、[0-9a-z]、[0-9a-zA-Z]
任意字符:[abcd]、[1234]
非在内的字符:[^a-z]、[^0-9]、[^abcd]

4、 定位符
•^  表示:开头标识
•$  表示:结尾标识
•\b   表示:单词边界
•\B  表示:非单词边界
5、转义符
•\   用于匹配某些特殊字符
6、选择匹配符
•|   可以匹配多个规则
7、特殊用法
•(?=) : 正向预查:匹配以指定内容结束的字符串
•(?!) : 负向预查:匹配不是以指定内容结束的字符串
•(?:) : 不把选择匹配符的内容放到缓冲区

四、正则表达式在Javascript下的使用方法

在Javascript下使用正则表达式,有两种方法:

第一种方法:使用RegExp类
提供的方法有:

•test(str): 在字符串匹配是否有匹配模式的字符串,返回true/false
•exec(str): 返回匹配模式匹配到的字符串,如果有,返回相应的字符串,无,返回null;
        //如果正则表达式中有子表达式,使用exec方法时

        //返回的是:result[0] = 匹配结果 , result[1] = 子表达式1的匹配结果 ……

第二种方法是:使用String类
提供的方法有:

•search : 返回匹配模式的字符串出现的位置,如果没有,返回-1
•match : 返回匹配模式匹配到的字符串,如果有,返回数组,无,返回null
•replace : 将匹配模式匹配到的字符串进行替换
•split : 将字符串已匹配模式为分隔符进行字符串分隔,返回数组

五、正则表达式在PHP下的使用方法

PHP下有两种使用正则表达式的函数:

第一种是:Perl正则表达式函数
提供的方法有:

•preg_grep --  返回与模式匹配的数组单元
•preg_match_all -- 进行全局正则表达式匹配
•preg_match -- 进行正则表达式匹配
•preg_quote -- 转义正则表达式字符
•preg_replace_callback -- 用回调函数执行正则表达式的搜索和替换
•preg_replace -- 执行正则表达式的搜索和替换
•preg_split -- 用正则表达式分割字符串
第二种是:POSIX正则表达式函数
提供的方法有:

•ereg_replace -- 替换正则表达式
•ereg -- 正则表达式匹配
•eregi_replace -- 不区分大小写替换正则表达式
•eregi -- 不区分大小写的正则表达式匹配
•split -- 用正则表达式将字符串分割到数组中
•spliti --  用正则表达式不区分大小写将字符串分割到数组中
•sql_regcase --  产生用于不区分大小的匹配的正则表达式 

六、总结

正则表达式就是我们实现某个功能的一个工具,这个工具:

1、功能强大
正则表达式中各种限定符的不同组合会实现不同的功能,有时实现一个复杂的功能需要编写很长的正则表达式,如何能精准匹配,这就要考验一个程序员的能力了。

2、简洁方便
平常我们在进行字符串内容查找,只能进行某个特定字符串的查找,但是正则表达式可以帮助我们进行模糊查找,更快更方便,仅仅需要一个正则表达式串。

3、各种语言基本上都支持
目前如JAVA、PHP、Javascript、C#、C++等主流语言都支持正则表达式。

4、学习很简单,应用很高深
学习正则表达式很快也很简单,但是如何在实际开发中编写出高效地,精准地正则表达式,还是需要长时间的尝试和积累。

如果想快速的入门推荐查看这篇文章:

正则表达式30分钟入门教程

时间: 2024-09-13 20:04:34

浅谈正则表达式(Regular Expression)_正则表达式的相关文章

共享日常收集JS正则表达式(JavaScript regular expression)_正则表达式

RegExp直接量和对象的创建 就像字符串和数字一样,程序中每个取值相同的原始类型直接量均表示相同的值,这是显而易见的.程序运行时每次遇到对象直接量(初始化表达式)诸如{}和[]的时候都会创建新对象.比如,如果在循环体中写var a = [],则每次遍历都会创建一个新的空数组.正则表达式直接量则与此不同,ECMAScript 3规范规定,一个正则表达式直接量会在执行到它时转换为一个RegExp对象,同一段代码所表示正则表达式直接量的每次运算都返回同一个对象.ECMAScript 5规范则做了相反

php 正则表达式(Regular Expression)用法

正则表达式(Regular Expression)   正则表达式系统: 1.POSIX 2.Perl   PHP中使用的regex是PCRE: NOTE:PCRE(Perl兼容正则表达式,Perl Compatible Regular Expressions)   PCRE语法: 1.定界符 必须成对出现,可以使用除0-9a-zA-Z以外的任何字符 2.原子 1.正则需要匹配的可见和不可见字符都是原子 2.一个正则表达式最少含有一个原子 3.当需要匹配诸如"("."[&qu

比较全面的C 、Java、JavaScript中的正则表达式详解_正则表达式

什么是正则表达式? 正则表达式(Regular Expression) 就是用某种模式去匹配一类字符串的公式.如你要在一篇文章中查找第一个字是"罗"最后一个字是"浩"的三个字的姓名,即"罗 * 浩":那么"罗 * 浩"就是公式,也称作 模式(Pattern) ,这篇文章就是 要匹配的串( 或叫文本 text) .再如,你要检查输入的一个字符串是否是 126 邮箱的格式,你得制定一个规则去查检,这种规则就是正则表达式. 从入门开

php的正则表达式完全手册_正则表达式

复制代码 代码如下: (?:pattern) 匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用.这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用.例如, 'industr(?:y|ies) 就是一个比 'industry|industries' 更简略的表达式. (?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串.这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用.例如,'Window

向大家推荐一个收集整理正则表达式的网站_正则表达式

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等.正则表达式是一种处理文本的有用工具,无论是验证用户输入.搜索字符串内的模式.还是以各种有效方式重新设置文本格式,正则表达式都非常有用.    大家都知道ASP.NET中有个RegularExpressionValidator的校验控件,其中有一个属性就是要填充自己所写的正则表达式,以作为校验的标准.    我向大家推荐的这个国

正则表达式学习笔记_正则表达式

正则表达式学习笔记 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含  有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等. 列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*  的含义是不同的. 为便于理解和记忆,先从一些概念入手,所有特殊字符或字符组合有一个总表在后面,最后一  些例子供理解相应的概念. 正则表达式 是由普通字符(例如字符 a 到 z)以及特殊字符(

正则表达式的语法_正则表达式

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等. 列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的. 构造正则表达式的方法和创建数学表达式的方法一样.也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式.正则表达式的组件可以是单个的字符.字符集合.字符范围.字符间的选择或者所有这些组件

浅谈正则表达式(Regular Expression)

一.什么是正则表达式? 简单的说:正则表达式(Regular Expression)是一种处理字符串匹配的语言: 正则表达式描述了一种字符串匹配的模式,可以用来检查一个字符串是否含有某种子串,对匹配到的子串进行"取出"或"替换"操作. 二.正则表达式的应用 正则表达式在实际的开发过程中非常实用,能够快速解决一些复杂的字符串处理问题,下面我对正则表达式的应用做一些简单分类: 第一种:数据验证 比如,你要验证一个字符串是否是正确的EMail,Telphone,Ip等等,

正则表达式regular expression详述(一)_正则表达式

 正则表达式是regular expression,看来英文比中文要好理解多了,就是检查表达式符不符合规定!!正则表达式有一个功能十分强大而又十分复杂的对象RegExp,在JavaScript1.2 版本以上提供.    下面我们看看有关正则表达式的介绍:    正则表达式对象用来规范一个规范的表达式(也就是表达式符不符合特定的要求,比如是不是Email地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法.    除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经