JavaScript核心参考教程--RegExp对象

博学,切问,近思--詹子知(http://blog.csdn.net/zhiqiangzhan

正则表达式基础

  1. 正则表达式的直接量字符
    字符 匹配
    字母数字字符 本身
    /o NUL字符(/u0000)
    /t 制位表(/u0009)
    /n 换行符(/u000A)
    /v 垂直制位表(/u000B)
    /f 换页符(/u000C)
    /r 回车(/u000D)
    /xnn 由十六进制数nn指定的拉丁字符,例如/u0A等价于/n
    /uxxxx 由十六进制数xxxx指定的Unicode字符,例如/u0009等价于/t
    /cX 控制字符X,例如,/cJ等价于/n
  2. 正则表达式的字符类
    字符 匹配
    [...] 位于括号内的任意字符
    [^...] 不在括号之中的任意字符
    . 除换行符和其他Unicode行中止符之外的任意字符
    /w 任何ASCII单字字符,等价于[a-zA-Z0-9_]
    /W 任何ASCII非单字字符,等价于[^a-zA-Z0-9_]
    /s 任何Unicode空白符[/f/n/r/t/v]
    /S 任何Unicode非空白符,注意/w和/S的不同[^/f/n/r/t/v]
    /d 任何ASCII数字,等价于[0-9]
    /D 除了ASCII数字之外的任何字符,等价于[^0-9]
    [/b] 退格直接量(特例)
  3. 正则表达式的重复字符
    字符 含义
    {n,m} 匹配前一项至少n次,但不能超过m次
    {n,} 匹配前一项n次,或更多次
    {n} 匹配前一项恰好n次
    ? 匹配前一项0次或1次,也就是说这一项是可选的。等价于{0,1}
    + 匹配前一项1次或多次。等价于{1,}
    * 匹配前一项0次或多次。等价于{0,}
    在正则表达式中,括号具有几种作用。一个作用是把单独的项目组合成子表达式,以便可以象处理一个
    独立的单元那样用|、*、+或?等来处理它们。括号的另一个作用是在完整的模式中定义子模式。当一
    个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部分。
  4. 正则表达式的选择、分组和引用字符
    字符 含义
    | 选择。匹配的是该符号的左边的子表达式或右边的子表达式
    (...) 组合。将几个项目组合为一个单元,这个单元可由|、*、+或?等符号使用,
    而且还可以记住和这个组合匹配的字符,以供此后的引用使用
    (?:...) 只组合。把项目组合到一个单元,但是不记忆与该组匹配的字符
    /n 和第n个分组第一次匹配的字符相匹配,组是括号中的子表达式(可能是嵌套
    的)。组号是从左到右计数的左括号数,以(?:形式分组的组不编码。
  5. 正则表达式的锚元素
    字符 含义
    ^ 匹配字符串的开头,在多行检索中,匹配一行的开头
    $ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
    /b 匹配一个词语的边界。简而言之,就是位于字符/w和/W之间的位置,或位于字符/w
    和字符串的开头和结尾的位置(但注意:[/b]匹配的是退格符)
    /B 匹配非词语边界的字符
    (?=p) 正前向声明,要求接下来的字符都与模式p匹配,但是不包括匹配中的那些字符
    (?!p) 反向前声明,要求接下来的字符不与模式P匹配
  6. 正则表达式的标志
    字符 含义
    i 执行大小写不敏感匹配
    g 执行一个全局匹配,简而言之,即找到所有匹配,而不是找到第一个之后就停止
    m 多行模式,^匹配一行的开头和字符串的开头,$匹配一行的结尾和字符串的结尾

JS中的RegExp对象

  1. 构造函数:

    显式构造函数,语法为:new RegExp("pattern"[,"flags"])。
    隐式构造函数,语法为: /pattern/[flags]。
  2. 静态属性
    index 是当前表达式模式首次匹配内容的开始位置,从0开始计数。其初始值为-1,每次成功匹配时,index属性都会随之改变。
    input 返回当前所作用的字符串,可以简写为$_,初始值为空字符串""。
    lastIndex 是当前表达式模式首次匹配内容中最后一个字符的下一个位置,从0开始计数,常被作为继续搜索时的起始位置,初始值为-1,表示从起始位置开始搜索,每次成功匹配时,lastIndex属性值都会随之改变。
    lastMatch 是当前表达式模式的最后一个匹配字符串,可以简写为$&。其初始值为空字符串""。在每次成功匹配时,lastMatch属性值都会随之改变。
    lastParen 如果表达式模式中有括起来的子匹配,是当前表达式模式中最后的子匹配所匹配到的子字符串,可以简写为$+。其初始值为空字符串""。每次成功匹配时,lastParen属性值都会随之改变。
    leftContext 是当前表达式模式最后一个匹配字符串左边的所有内容,可以简写为$`(其中“'”为键盘上“Esc”下边的反单引号)。初始值为空字符串""。每次成功匹配时,其属性值都会随之改变。
    $1…$9 这些属性是只读的。如果表达式模式中有括起来的子匹配,$1…$9属性值分别是第1个到第9个子匹配所捕获到的内容。 如果有超过9个以上的子匹配,$1…$9属性分别对应最后的9个子匹配。在一个表达式模式中,可以指定任意多个带括号的子匹配, 但RegExp对象只能存储最后的9个子匹配的结果。在RegExp实例对象的一些方法所返回的结果数组中,可以获得所有圆括号内的子匹配结果。
  3. 实例属性
    global 返回创建RegExp对象实例时指定的global标志(g)的状态。如果创建RegExp对象实例时设置了g标志,该属性返回True,否则返回False,默认值为False。
    ignoreCase 返回创建RegExp对象实例时指定的ignoreCase标志(i)的状态。如果创建RegExp对象实例时设置了i标志,该属性返回True,否则返回False,默认值为False。
    multiLine 返回创建RegExp对象实例时指定的multiLine标志(m)的状态。如果创建RegExp对象实例时设置了m标志,该属性返回True,否则返回False,默认值为False。
    source 返回创建RegExp对象实例时指定的表达式文本字符串。
  4. 实例方法
    exec 语法格式为exec(str)。该方法使用创建RegExp对象实例时所指定的表达式模式对一个字符串进行搜索,并返回一个包含搜索结果的数组。
    如果为正则表达式设置了全局标志(g),可以通过多次调用exec和test方法在字符串中进行连续搜索,每次都是从RegExp对象的lastIndex属性值指定的位置开始搜索字符串。
    如果没有设置全局标志(g),则exec和test方法忽略RegExp对象的lastIndex属性值,从字符串的起始位置开始搜索。 如果exec方法没有找到匹配,返回值为null;如果找到匹配,则返回一个数组,并更新RegExp对象中有关静态属性以反映匹配情况。 返回数组中的元素0包含了完整的匹配结果,而元素1~n依次是表达式模式中定义的各个子匹配的结果。
    test 语法格式为test(str)。该方法检查一个字符串中是否存在创建RegExp对象实例时所指定的表达式模式,如果存在就返回True,否则返回False。 如果找到匹配项,则会更新RegExp对象中的有关静态属性,以反映匹配情况。
    compile 语法格式为compile("pattern"[,"flags"])。该方法可以更换RegExp对象实例所使用的表达式模式,并将新的表达式模式编译为内部格式,从而使以后的匹配过程执行更快。
  5. RegExp说明

    默认情况下,正则表达式使用最长(也叫贪婪)匹配原则.当?紧随其它限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式变成使用最短(也叫非贪婪)匹配原则.

    分组组合符就是将正则表达式中的某一部分内容组合起来的符号,反向引用符则是用于匹配前面的分组组合所捕获到的内容标识符号
    (1) (pattern)将圆括号中的pattern部分组合成一个可统一操作的组合项和子匹配,每个捕获
    的子匹配项按照它们在正则表达式模式中从左到右出现的顺序存储在缓冲区中.缓冲区从1开始编号,最多可存储99个子匹配捕获的内容.存储在缓冲区中的子匹配捕获的内容,可以在编程语言中被检索,也可以在正则表达式中被反向引用.若要匹配字面意义的括号字符"("和")",在正则表达式中要分别使用"/("和"/)".
    (2) /num匹配编号为num的缓冲区所保存的内容,此处的num是一个标识特定缓冲区的一位或两位十进制正整数,这种方式称为子匹配的反向引用.反向引用最有用的应用之一就是能提供表示相同匹配项的能力,例如,要匹配连续的5个数字字符,可以使用/d{5}作为正则表达式文本,它可以匹配12345,但是,要匹配连续的5个相同的数字字符,如55555、11111等,需要使用(/d)/1{4}作为正则表达式文本,/1表示与前面(/d)所捕获的内容一样,/1{4}则表示前面的(/d)所捕获的内容还连续出现4次.又例如,要匹配"Is is the cost of of gasoline going up up?"中所有连续重复的单词部分,可以使用//b([a-z]+)/1/b/gi作为正则表达式文本.
    (3) (?:pattern) 将圆括号中的pattern部分组合成一个可统一操作的组合项,但不把这部分内容当作子匹配捕获,即pattern部分是一个非捕获匹配,它匹配的内容不存储在缓冲区中供以后使用.这对必须进行组合、但又不想让组合的部分具有子匹配特点的情况很有用.
    (4) (?=pattern)称为正向"预测先行"匹配,在被搜索字符串的相应位置必须有pattern部分匹配的内容,但这部分匹配的内容不作为匹配结果处理,更不会被存储在捕获缓冲区中供以后使用.(?=pattern)必须位于一个正则表达式模式的最前或最后面.
    (5) (?!pattern)称为反向"预测先行"匹配,在被搜索的字符串的相应位置不能有pattern部分匹配的内容,除此之外,功能与正向"预测先行"匹配一样.

实例演示

  • 简单示例

    1.测试RegExp属性。 function demo(){
    var str = "abcdd abcsszabcdddccabAbcddABCEE";
    var regex = /a(bc)/gi;
    var t = null;
    while(t = regex.exec(str)){
    var result = "index = " + t.index + ", match = " + t[0] + ", group = " + t[1];
    result += "/n$1=" + RegExp.$1 + ", lastMatch=" + RegExp.lastMatch + ", leftContext=" + RegExp.leftContext;
    alert(result);
    }
    }Show Demo

    2.正则表达式扩展。//为RegExp实例扩展一个replaceAll方法,实现虽然简单,但很实用。
    RegExp.prototype.replaceAll = function(str, func){
    var last = 0, index = 0, t = null, ret = '';
    while(t = this.exec(str)){
    index = RegExp.index;
    ret += str.substring(last, index);
    ret += func(t);
    last = RegExp.lastIndex;
    }
    ret += str.substring(last, str.length);
    return ret;
    }

    //本例演示了如何利用该扩展去除重复字符。
    function testReplaceAll(){
    var str = "aaaabbbbccccddddeeeefffff";
    var regex = /(/w)/1+/gi;
    var result = regex.replaceAll(str, function(t){
    return t[1] + ' ';;
    });
    alert(result);
    }testReplaceAll

  • 注意事项

    (?<=exp)零宽度正回顾后发断言(不支持)
    (?<!exp)零宽度负回顾后发断言(不支持)
  • 参考资料

    正则表达式30分钟入门教程
时间: 2024-10-06 03:18:11

JavaScript核心参考教程--RegExp对象的相关文章

JavaScript核心参考教程--内置对象

博学,切问,近思--詹子知 (https://jameszhan.github.io) JavaScript 是根据 "ECMAScript"标准制定的网页脚本语言.这个标准由 ECMA 组织发展和维护.ECMA-262 是正式的 JavaScript 标准.这个标准基于 JavaScript (Netscape) 和 JScript (Microsoft).Netscape (Navigator 2.0) 的 Brendan Eich 发明了这门语言,从 1996 年开始,已经出现在

JavaScript 核心参考教程 内置对象_js面向对象

这个标准基于 JavaScript (Netscape) 和 JScript (Microsoft).Netscape (Navigator 2.0) 的 Brendan Eich 发明了这门语言,从 1996 年开始,已经出现在所有的 Netscape 和 Microsoft 浏览器中.ECMA-262 的开发始于 1996 年,在 1997 年 7 月,ECMA 会员大会采纳了它的首个版本. 本系列教程旨在向大家分享本人当年学习Javascript的笔记和心得.本系列教程预计分五个部分. 第

每天一篇javascript学习小结(RegExp对象)_javascript技巧

1.正则表达式test方法 var text = "cat, bat, sat, fat"; var pattern = /.at/; if (pattern.test(text)){ alert("The pattern was matched."); } 2.正则的toString()方法 var pattern = new RegExp("\\[bc\\]at", "gi"); alert(pattern.toStrin

javascript RegExp 对象属性与方法和应用

JavaScript提供了一个RegExp对象来完成有关正则表达式的操作和功能,每一条正则表达式模式对应一个RegExp实例.有两种方式可以创建RegExp对象的实例. 使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScri

javascript技巧参考大全

javascript技巧参考大全 事件源对象 event.srcElement.tagName event.srcElement.type 捕获释放 event.srcElement.setCapture();  event.srcElement.releaseCapture();  事件按键 event.keyCode event.shiftKey event.altKey event.ctrlKey 事件返回值 event.returnValue 鼠标位置 event.x event.y 窗

JavaScript 参考教程

javascript|参考|教程 JavaScript 是使用"对象化编程"的,或者叫"面向对象编程"的.所谓"对象化编程",意思是把 JavaScript 能涉及的范围划分成大大小小的对象,对象下面还继续划分对象直至非常详细为止,所有的编程都以对象为出发点,基于对象.小到一个变量,大到网页文档.窗口甚至屏幕,都是对象.这一章将"面向对象"讲述 JavaScript 的运行情况. 对象的基本知识  对象是可以从 JavaScr

JavaScript 参考教程_基础知识

JavaScript 参考教程  javascript 是使用"对象化编程"的,或者叫"面向对象编程"的.所谓"对象化编程",意思是把 javascript 能涉及的范围划分成大大小小的对象,对象下面还继续划分对象直至非常详细为止,所有的编程都以对象为出发点,基于对象.小到一个变量,大到网页文档.窗口甚至屏幕,都是对象.这一章将"面向对象"讲述 javascript 的运行情况.  对象的基本知识  对象是可以从 javasc

注意JavaScript中RegExp对象的test方法

javascript|对象 javascript 中的 RegExp 对象用于正则表达式相关的操作,这个对象提供了一个方法 test 来判定某个字符串是否满足某个 pattern. 返回值是 true/false.今天我碰到了一个问题: <script type="text/javascript"><!--var re = /^\d+(?:\.\d)?$/ig;    alert(re.test('112.3'));alert(re.test('33'));//--&

详解JavaScript正则表达式之RegExp对象_javascript技巧

一.RegExp对象概述        RegExp对象表示正则表达式,RegExp是正则表达式的缩写,它是对字符串执行模式匹配的强大工具.RegExp对象用于规定在文本中检索的内容.当您检索某个文本时,可以使用一种模式来描述要检索的内容.RegExp就是这种模式.简单的模式可以是一个单独的字符:更复杂的模式包括了更多的字符,并可用于解析.格式检查.替换等. 正则表达式可以规定字符串中的检索位置,以及要检索的字符类型等.二.创建RexExp对象 创建正则表达式和创建字符串类似,创建正则表达式有两