Java正则之贪婪匹配、惰性匹配_java

贪婪量词:

先看整个字符串是不是一个匹配。如果没有发现匹配,它去掉最后字符串中的最后一个字符,并再次尝试。如果还是没有发现匹配,那么    再次去掉最后一个字符串,这个过程会一直重复直到发现一个匹配或者字符串不剩任何字符。简单量词都是贪婪量词。

惰性量词:

先看字符串中的第一个字母是不是一个匹配,如果单独着一个字符还不够,就读入下一个字符,组成两个字符的字符串。如果还没有发现匹配,惰性量词继续从字符串中添加字符直到发现一个匹配或者整个字符串都检查过也没有匹配。惰性量词和贪婪量词的工作方式恰好相反。

支配量词:

只尝试匹配整个字符串。如果整个字符串不能产生匹配,不做进一步尝试。

    贪婪量词   惰性量词    支配量词                      描述
    -------------------------------------------------------------------------------------
      ?             ??             ?+                      可以出现0次或1次,但至多出现1次
      *             *?            *+                      可以出现任意次,也可以不出现
      +             +?            ++                      出现1次或多次,但至少出现1次
      {n}        {n}?           {n}+                   一定出现n次
      {n,m}    {n,m}?       {n,m}+               至少出现n次,但至多不能超过m次
      {n,}       {n,}?          {n,}+                 可以出现任意次,但至少出现n次
    例如:我们要从字符串abbbaabbbaaabbb1234中获得abbb,aabbb,aaabbb的匹配

    1、贪婪量词

复制代码 代码如下:

       var regexp = /.*bbb/g;
        var a = str.match(regexp);
        alert(a.length);   //output:1
        alert(a[0]);       //output:abbbaabbbaaabbb

    贪婪量词的工作过程可以这样表示:
      a)abbbaabbbaaabbb1234
      b)abbbaabbbaaabbb123
      c)abbbaabbbaaabbb12
      d)abbbaabbbaaabbb1
      e)abbbaabbbaaabbb //true
    可以看到,贪婪量词在取得一次匹配后就会停止工作,虽然我们加了'g'(全局匹配)

    2、惰性量词

复制代码 代码如下:

        var regexp = /.*?bbb/g;
        var a = str.match(regexp);
        alert(a.length);   //output:3
        alert(a[0]);       //output:abbb
        alert(a[1]);       //output:aabbb
        alert(a[2]);       //output:aaabbb

    惰性量词的工作过程可以这样表示:
      a)a
      b)ab
      c)abb
      d)abbb //保存结果,并从下一个位置重新开始
 
      e)a
      f)aa
      g)aab
      h)aabb
      j)aabbb //保存结果,并从下一个位置重新开始
 
      e)a
      e)aa
      e)aaa
      e)aaab
      e)aaabb
      e)aaabbb  //保存结果,并从下一个位置重新开始
    由于JS是不支持支配量词的,所以支配量词我们只能用JAVA来演示:

复制代码 代码如下:

        String string = "abbbaabbbaaabbb1234";
        Pattern p = Pattern.compile(".*+bbb");
        Matcher m = p.matcher(string);
        System.out.println(m.find());   //output:false

    因为支配量词采用一刀切的匹配方式,如:
    a)abbbaabbbaaabbb1234 //false

以上所述就是本文的全部内容了,希望大家能够喜欢,能够对大家熟练掌握java正则匹配有所帮助。

请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!

时间: 2024-11-11 03:10:24

Java正则之贪婪匹配、惰性匹配_java的相关文章

正则验证-java 正则匹配数据中的金钱数字

问题描述 java 正则匹配数据中的金钱数字 A文件数据:1001分店20121231,元旦之际祝您新年快乐身体健康万事如意.您共欠担保公司¥103959.50元.请您尽快偿还欠款,以免扩大损失.您的借款已逾期6天,欠款金额为1988.20元,逾期将影响信用记录,请即刻缴纳.截止 2015年07月01日 您应还金额为:4128元.如有疑问,请联系王先生1101101010.你好,截至到昨天夜里23:59,你欠款34532.32元,请您尽快偿还欠款,以免扩大损失.你好,截至到昨天夜里23:59,你

java 正则 截取字符串-java 正则匹配String字符串截取问题

问题描述 java 正则匹配String字符串截取问题 比如现在有这样一个字符串 " A4,80列,三层,带双列线,二等分 白色 1200页/箱 ,10箱/包 " 我需要把它分开处理, "A4,80列,三层,带双列线 ,二等分"作为产品的规格,**"白色"**作为产品的颜色,**"1200页/箱 ,10箱/包"**作为产品的包装,现在我想用正则表达式来匹配,但是不知道怎么取写,我只要能分开获取到,剩下的我就可以处理,现在就是分

java 正则匹配空格字符串 正则表达式截取字符串

  java 正则匹配空格字符串 正则表达式截取字符串 需求:从一堆sql中取出某些特定字符串: 比如配置的sql语句为:"company_code = @cc and project_id = @pid ; update t set a = @aa,b=@bb,c=@cd,ttt=@ttt;update t2 set d=@bb"; 我要拿出所有的以@开头的作为变量,并且去重,则如下玩: ps:其中正则匹配空格是 "\s+"   public class Test

正则基础之 NFA引擎匹配原理_正则表达式

1       为什么要了解引擎匹配原理 一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或许不知道该如何去改变音符的组合,使得乐曲更动听. 作为正则的使用者也一样,不懂正则引擎原理的情况下,同样可以写出满足需求的正则,但是不知道原理,却很难写出高效且没有隐患的正则.所以对于经常使用正则,或是有兴趣深入学习正则的人,还是有必要了解一下正则引擎的匹配原理的. 2       正则表达式引擎

正则表达式惰性匹配模式(?)

正则表达式惰性匹配模式: 在贪婪匹配模式一章节已经说过人性是贪婪的,希望获得更多的金钱.地位甚至美女,但是也有很多清心寡欲的人,只要满足基本的生活需求就可以了,在正则表达式中也有这样的匹配原则,下面就进行一下介绍. 一.惰性模式的概念: 此模式和贪婪模式恰好相反,它尽可能少的匹配字符以满足正则表达式即可,例如: var str="axxyyzbdkb"; console.log(str.match(/a.*b/)); 以上代码是贪婪模式,于是能够匹配整个字符串,下面将其修改成惰性匹配模

正则基础之 NFA引擎匹配原理

1       为什么要了解引擎匹配原理 一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或许不知道该如何去改变音符的组合,使得乐曲更动听. 作为正则的使用者也一样,不懂正则引擎原理的情况下,同样可以写出满足需求的正则,但是不知道原理,却很难写出高效且没有隐患的正则.所以对于经常使用正则,或是有兴趣深入学习正则的人,还是有必要了解一下正则引擎的匹配原理的. 2       正则表达式引擎

java正则实现各种日期格式化_java

java正则实现各种日期格式化 package com.st.test; import java.text.DateFormat; import java.text.SimpleDateFormat; import java.util.Date; import java.util.HashMap; import java.util.regex.Pattern; public class DateFormatUtil { @SuppressWarnings("finally") publ

java大文件-java 大文件处理及内容匹配

问题描述 java 大文件处理及内容匹配 读取5G左右txt文件,内容都是由一定格式的长字符串组成,如{a:xxxxxxx}{b:xxxxxx}{c:xxxxxx}... 其中{a:xxxxxxx}为一段,{b:xxxxxxx}为下一段,依次类推. 要求:如果{a:xxxxxxx}中包含目标字符串"XXX",则将{a:xxxxxxx}输出到文件. 目前基本功能已实现,但处理效率比较低,求大牛们提供好的解决思路. 解决方案 每次读取10MB左右的数据,然后分多个块,让多个线程去匹配.循环

java在多个字符串里匹配

问题描述 java在多个字符串里匹配 每当我得到一个字符串我要和5000多个字符串去匹配寻找相同的, 可以把5000多个字符串做成文件在java里通过流读取匹配吗,或者有更好的方法吗, 解决方案 最好的办法是做倒排索引,搜索引擎的全文搜索就是这么实现的. 解决方案二: 例子http://download.csdn.net/detail/a1298071341/3335929 解决方案三: 可以放到文件中: 也可以把5000个字符串放到数据库中,然后判断是否存在数据库里 解决方案四: 5000个字