JScript中正则表达式用法详解_正则表达式

呵呵,先罗嗦几句,去年用C#做了一个语法高亮的小东西,根据配制文件中的信息把所给代码格式化成HTML,使它能在网页上显示出和编辑器里一样的语法元素高亮的效果以及支持代码折叠。没错,就是和博客园上看到的类似啦。因为我当时使用的是MSN Space,它没有提供这项功能,只好自己写一个咯。

    我使用的是C#进行编写,起初使用的是超级繁琐的for,while,switch,if等基本语句来判断关键字等等,大家莫笑话,本人愚笨当时还不知道正则表达式是何物,所以只能用这种土办法了,当然土办法还是有效果的,只是一个函数里冗长的代码,以后要维护起来恐怕是非常难的,心想别的软件不可能是这么写的吧,于是乎到google上搜索了一阵,找到了些语法高亮的代码和开源项目,开起来一看。。。。。晕,一个个都那么复杂,说实在我最不喜欢做的事就是看别人代码了,不是我自命不凡,实在看别人代码实在是很晕,除非是有非常详细的文档描述,要不然我瞄两眼就不想看了,顶多是看看别人接口怎么写的,然后猜测他内部怎么实现。

    虽然搜索来的东西没有多大帮助,不过还是让我知道了正则表达式这个东东,具体忘记哪里看到的了。当时就开始一边研究正则表达式一边改造偶那“破玩意儿”。接着没多久在博客园重新开博了,终于开用上博客园的语法加亮功能啦,于是自己写个代码HTML高亮显示的东东就失去了一个主要动力了。其次,用C#做的语法高亮模块,只能运行在服务器端,或者WinForm程序上,而我最终要获取的是HTML代码以显示在页面上,我认为还是客户端脚本最适合这项工作。只可惜自己对JS并不甚了解。。。后来这段时间又胡搞瞎搞别的去了,也没有再改进那个语法加亮模块了。

    昨天加班晚上加班回到家里,本来打算继续学习下UML见模,后来想起公司有一个模块需要能剔出数据库返回结果中的所有HTML标签,我便打开正则表达式工具RegexBuddy。结果RegexBuddy的帮助文档时看到了JScript使用正则表达式的简单教学,于是乎好奇心又起,打开UltraEdit-32开始写简单的JavaScript试验起来。

    我的试验过程这里就不多废话再复述了,因为很多地方是反复试验绕很多弯路的,这里就直接给出试验总结出来的JScript中正则的用法。

    废话完毕,下面进入正题!   

    首相讲讲JScript的正则表达式对象RegExp。 

    JScript中提供正则表达式操作的类名为RegExp,可以用两种方式实例化RegExp类型的对象。   

    方法一,构造函数实例化: 

var myRegex = new RegExp("\\w+", "igm ");  
//\w+为实际正则表达式,注意第一个\为转义之用,igm分别表示忽略大小写,全局搜索,多行搜索,这个后面会解释  
    方法二,直接赋值法: 

var myRegex = /\w+/igm;  
//效果与上一个语句一样,只是这里不需要用转移字符,原正则表达式是什么样子就是什么样子,igm就和前面例子的igm作用一样 
    具体用什么方式看大家喜好了,个人觉得第二种方式写的正则比较好读些,RegexBuddy帮助文档也是推荐第二种方式。   RegExp对象包含以下一些操作:

    exec(string str):执行正则表达式匹配,并返回匹配结果,根据MSDN给出的例子运行结果看,exec每次执行都是从上次直接的匹配结束位置开始,并且返回的值似乎是RerExp对象,而RegexBuddy给出的解释是返回一个数组,但是没有给出详细例子,我觉得还是根据试验结果为依据比较可靠。   

    compile(string regex, string flags):预编译正则表达式以使其运行更快,经过测试的确预先编译后效率有明显提升。regex参数为正则表达式,flags可以为以下3个值的组合: g – 全局搜索,我的试验结果是不加g标志就只能匹配第一个符合条件的字符串 i – 忽略大小写 m – 多行搜索,似乎默认已经是多行搜索了   

    test(string str):如果str匹配正则表达式返回true,否则返回false,这个类似string对象的match方法   

    RegExp对象包含以下一些属性:

    index:字符串中第一个匹配表达式的位置,初始为-1   
    input:正则表达式的匹配目标,注意是只读的   
    lastIndex:下一个匹配表达式的位置,原话是(Returns the character position where the next match begins in a searched string.)也不知道有没有翻译错,这个属性我没有用到。   
    lastMatch:最后一个匹配表达式的字符串   
    lastParen:最后一个匹配的子匹配串,比如正则表达式里有多个以()分组的匹配项,lastParen表示最后一组所匹配的结果
    leftContext:从目标字符串的开头到last match的起始位置的所有字符。   
    rightContext:从last match的结束位置到整个目标字符串的结束位置的所有字符。   
    $1…$9:表示第n组匹配的结果,这个在正则表达式里有多个以()分组时有用

    接下来讲讲,JScript中String对象与正则表达式有关的操作: 

    match(string regex):接受一个正则表达式,并返回该字符串是否与这个表达式匹配。 
    replace(srting regex, string str):将与正则表达式匹配的子字符串替换为str,这个函数看似简单,不过还隐藏着更高级用法哦,请看以下例子。
    例子1: 

var str1 = "A:My name is Peter!\nB:Hi Peter!";
str1 = str1.replace(/Peter/g,"Jack");
alert(str1);
      这个例子很简单就是把字符串替换了,这则表达式的威力当然不只于此,如果你用的熟练,还能用它完成很多以往需要大量代码完成的工作。比如在代码关键字前后加上由于高亮显示的HTML标签。从前面例子看来似乎replace只能把匹配的文本替换成新的文本啊,怎么利用它在关键字前后插入标签呢?返过来想象,如果在替换时能利用匹配结果,那么事情不就好办了,只要将关键字替换为:标签头 + 关键字 + 标签尾 不就行了。

    可是要如何在replace中使用正则表达式匹配的结果呢?

    这时候我们就需要用到“匹配变量”了,匹配变量用于表示正则匹配的结果,以下是匹配变量的说明: 
    $& -- 表示全部匹配组匹配的结果,最后再啰嗦一次,匹配组就是正则表达式的()分组 
    $$ -- 表示$字符,因为匹配变量用掉了$字符,所以需要转义 
    $n -- 类似前面的$1…$9,表示第n组匹配的结果 
    $nn -- 很简单就是第nn组匹配的结果 
    $` -- 就是前面提到过的leftContext,比如abcdefg被匹配出了d那么abc就是它的leftContext了 
    $'  -- 和上面符合很接近不要看错了!,这个就是rightContext了,举一反三,efg就是上面例子的rightContext了   那么现在我们要做到在关键字前后插入标签就很简单了: 

var str1 = "A:My name is Peter!\nB:Hi Peter!";
str1 = str1.replace(/Peter/g, "<b>$&</b>"); 
alert(str1);
    都0:39了。。。就写到这里吧。

    正则工具软件下载(密码: regex):regex buddy 2.06.zip
    我写的例子请看:JScript做语法加亮显示(代码精简)

    一下是MSDN载抄的一些例子:

function matchDemo()
{
   var s;
   var re = new RegExp("d(b+)(d)","ig");
   var str = "cdbBdbsbdbdz";
   var arr = re.exec(str);
   s = "$1 contains: " + RegExp.$1 + "\n";
   s += "$2 contains: " + RegExp.$2 + "\n";
   s += "$3 contains: " + RegExp.$3;
   return(s);
}
function RegExpTest()
{
  var ver = Number(ScriptEngineMajorVersion() + "." + ScriptEngineMinorVersion())
  if (ver >= 5.5){
    var src = "The rain in Spain falls mainly in the plain.";
    var re = /\w+/g;
    var arr;
    while ((arr = re.exec(src)) != null)
       print(arr.index + "-" + arr.lastIndex + "\t" + arr);
  }
  else{
    alert("You need a newer version of JScript for this to work");
  }
}

function matchDemo()
{
   var s;                                //Declare variable.
   var re = new RegExp("d(b+)(d)","ig"); //Regular expression pattern.
   var str = "cdbBdbsbdbdz";             //String to be searched.
   var arr = re.exec(str);               //Perform the search.
   s = "$1 returns: " + RegExp.$1 + "\n";
   s += "$2 returns: " + RegExp.$2 + "\n";
   s += "$3 returns: " + RegExp.$3 + "\n";
   s += "input returns : " + RegExp.input + "\n";
   s += "lastMatch returns: " + RegExp.lastMatch + "\n";
   s += "leftContext returns: " + RegExp.leftContext + "\n";
   s += "rightContext returns: " + RegExp.rightContext + "\n"; 
   s += "lastParen returns: " + RegExp.lastParen + "\n";
   return(s);                            //Return results.
}
document.write(matchDemo());

    各位路过的大侠如果对本文有什么看法欢迎在此提出,大家共同学习,共同进步。

时间: 2024-10-21 01:20:15

JScript中正则表达式用法详解_正则表达式的相关文章

正则表达式问号的四种用法详解_正则表达式

原文符号 因为?在正则表达式中有特殊的含义,所以如果想匹配?本身,则需要转义,\? 有无量词 问号可以表示重复前面内容的0次或一次,也就是要么不出现,要么出现一次. 非贪婪匹配 贪婪匹配 在满足匹配时,匹配尽可能长的字符串,默认情况下,采用贪婪匹配 string pattern1 = @"a.*c"; // greedy match Regex regex = new Regex(pattern1); regex.Match("abcabc"); // return

linux grep正则表达式与grep用法详解_正则表达式

需要大家牢记:正则表达式与通配符不一样,它们表示的含义并不相同      正则表达式只是字符串的一种描述,只有和支持正则表达式的工具相结合才能进行字符串处理.本文以grep为例来讲解正则表达式. grep命令 功能:输入文件的每一行中查找字符串. 基本用法: grep [-acinv] [--color=auto] [-A n] [-B n] '搜寻字符串' 文件名 参数说明: -a:将二进制文档以文本方式处理 -c:显示匹配次数 -i:忽略大小写差异 -n:在行首显示行号 -A:After的意

C#正则表达式之Regex类用法详解_正则表达式

Regex 类表示不可变(只读)的正则表达式.它还包含各种静态方法,允许在不显式创建其他类的实例的情况下使用其他正则表达式类. 正则表达式基础概述 什么是正则表达式    在编写字符串的处理程序时,经常会有查找符合某些复杂规则的字符串的需要.正则表达式就是用于描述这些规则的工具.换句话说,正则表达式就是记录文本规则的代码.     通常,我们在使用WINDOWS查找文件时,会使用通配符(*和?).如果你想查找某个目录下的所有Word文档时,你就可以使用*.doc进行查找,在这里,*就被解释为任意

linux正则表达式awk详解_正则表达式

awk和sed一样是流式编辑器,它也是针对文档中的行来操作的,一行一行的去执行.awk比sed更加强大,它能做到sed能做到的,同样也能做到sed不能做到的.awk常用来分段: awk不用加任何参数就可以实现 + ? * .  | 这些特殊符号: 1.截取文档中的某个段 [root@yonglinux ~]# head -n2 passwd |awk -F: '{print $1}' root bin [root@yonglinux ~]# head -n2 passwd |awk -F: '{

ASP.NET中IsPostBack用法详解_实用技巧

本文针对ASP.NET中IsPostBack的用法进行了详细的说明,有助于读者更准确的掌握ASP.NET中IsPostBack的用法. 一.IsPostBack介绍: Page.IsPostBack是一个标志:当前请求是否第一次打开.调用方法为:Page.IsPostBack或者IsPostBack或者this.IsPostBack或者this.Page.IsPostBack,它们都等价. 1)当通过IE的地址栏等方式打开一个URL时是第一次打开, 当通过页面的提交按钮或能引起提交的按钮以POS

JavaScript在XHTML中的用法详解_基础知识

编写XHTML代码的规则要比编写HTML要严格得多,类似下面的代码在HTML中是有效的,但在XHTML中则是无效的. [javascript] 复制代码 代码如下: <script type="text/javascript"> function compare(a, b) { if(a < b) { alert("a is less then b"); } else if(a > b) { alert("a is greater

正则表达式基本语法详解_正则表达式

正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符").模式描述在搜索文本时要匹配的一个或多个字符串. 1.正则表达式基本语法 两个特殊的符号'^'和'$'.他们的作用是分别指出一个字符串的开始和结束.例子如下: "^The":表示所有以"The"开始的字符串("There","The cat"等): "of despair$":表示所以以&q

Elasticsearch——Date Math在索引中的用法详解

在elasticsearch中,有时会想要通过索引日期来筛选查询的数据,此时就需要用到日期数学表达式. 更多内容参考Elasticsearch翻译汇总 基于日期数学表达式的索引 模式如下: <static_name{date_math_expr{date_format|time_zone}}> 其中各个字段含义为: static_name 是索引的静态部分 date_math_expr 是日期的表达式 date_format 格式化,默认是YYYY.MM.dd time_zone 时区,默认是

比较全面的C 、Java、JavaScript中的正则表达式详解_正则表达式

什么是正则表达式? 正则表达式(Regular Expression) 就是用某种模式去匹配一类字符串的公式.如你要在一篇文章中查找第一个字是"罗"最后一个字是"浩"的三个字的姓名,即"罗 * 浩":那么"罗 * 浩"就是公式,也称作 模式(Pattern) ,这篇文章就是 要匹配的串( 或叫文本 text) .再如,你要检查输入的一个字符串是否是 126 邮箱的格式,你得制定一个规则去查检,这种规则就是正则表达式. 从入门开