浅谈Java中正则表达式的优化方法

获取每次使用引起小损失的分组。如果你实际并不需要获取一个分组内的文本,那么 就使用非捕获分组。例如使用“(?:X)”代替“(X)”。

让引擎完成优化(Let the engine do the work for you)

如上面我所提到的,java.util.regex包可以编JAVA译正则表达式时对其优化。例如, 正则表达式中包含了一个必须在输入字符串中出现的字符串(或者整个表达式都不匹配) ,引擎有时会首先搜索该字符串,如果没有找到匹配就会报告失败,不再检查整个正则表 达式。

另外非常有用地自动优化正则表达式的方式让引擎根据正则表达式中的期望长度检查 输入字符串的长度。例如,表达式“\d{100}”是内在优化的,以致于如果输入 字符串不是JAVA100个字符,引擎就会报告失败,而不再考察整个正则表达式。

无论何时编写复杂的正则表达式时,尝试找出一种编写方式使引擎可以识别和优化这 些特殊情况。例如,不要在分组或选择中隐藏命令字符串,因为引擎不会识别它们。若有 可能,指定你想要匹JAVA配的输入字符串的长度也是相当有用的,如上例所示。

优化贪婪模式和勉强模式(Optimizing greedy and reluctant quantifiers)

你已经有了如何优化正则表达式的基本概念,其中一些方式可以JAVA让引擎来完成优 化。现在我们讨论优化贪婪模式和勉强模式。贪婪模式量词如“*”或 “+”,会首先从输入字符串中尝试匹配尽可能多的字符,即使这意味着字符 串中的剩下的内容已经不足以匹配正则表达式的其余部分。如果是这样,贪婪模式量词就 会回缩,返回字符,知道可以完全匹配或者没有字符了。勉强(或者lazy)模式,另一方 面,会首先尝试匹配输入字符串中尽可能少的字符。

时间: 2024-08-03 10:14:22

浅谈Java中正则表达式的优化方法的相关文章

浅谈java8中map的新方法--replace_java

Map在Java8中新增了两个replace的方法 1.replace(k,v) 在指定的键已经存在并且有与之相关的映射值时才会将指定的键映射到指定的值(新值) 在指定的键不存在时,方法会return回来一个null javadoc的注释解释了该默认值方法的实现的等价Java代码: if (map.containsKey(key)) { return map.put(key, value); } else { return null; } 下面展示的是新方法和JDK8之前的方法比较: /* *

浅谈java中BigDecimal的equals与compareTo的区别_java

这两天在处理支付金额校验的时候出现了点问题,有个金额比较我用了BigDecimal的equals方法来比较两个金额是否相等,结果导致金额比较出现错误(比如3.0与3.00的比较等). [注:以下所讲都是以sun jdk 1.4.2版本为例,其他版本实现未必一致,请忽略] 首先看一下BigDecimal的equals方法: public boolean equals(Object x){ if (!(x instanceof BigDecimal)) return false; BigDecima

浅谈Java中的可变参数_java

可变参数 可变参数就是一个方法可以接收任意多个参数!例如:fun().fun(1).fun(1,1).fun(1,1,1).你可能认为这是方法重载,但这不是重载,你想想重载能重载多少个方法,而fun()方法是可以传递任何个数的参数,你能重载这么多个方法么? 2.1 定义可变参数方法 public voidfun(int- arr) {} 上面方法fun()的参数类型为int-,其中"-"不是省略号,而是定义参数类型的方式.参数arr就是可变参数类型.你可以把上面代码理解为:public

浅谈Java中的final关键字与C#中的const, readonly关键字_java

在编程语言中都有某种方式,告知编译器一块数据是恒定不变的.有两个需求 1. 一个永不改变的编译器常量 2. 一个在运行时被初始化的值,而这个值不会被改变 在Java中,使用final修饰变量实现这两个需求 <pre name="code" class="java">//编译器常量 private final int valueOne = 9; private static final int VALUE_TWO = 99; public static f

浅谈Java中常用数据结构的实现类 Collection和Map_java

线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构.这些类均在java.util包中.本文试图通过简单的描述,向读者阐述各个类的作用以及如何正确使用这些类. Collection ├List │├LinkedList │├ArrayList │└Vector │ └Stack └Set Map ├Hashtable ├HashMap └WeakHashMap Collection接口 Collection是最基本的集合接口,一个C

浅谈Java中的克隆close()和赋值引用的区别_java

学生类Student: package 克隆clone; /*要克隆必须实现这个借口:Cloneable,以标记这个对象可以克隆 Cloneable:此类实现了 Cloneable 接口,以指示 Object.clone() 方法可以合法地对该类实例进行按字段复制. 这个接口是标记接口,告诉我们实现该接口的类就可以实现对象的复制了. */ public class Student implements Cloneable { private String name; private int ag

浅谈java中异步多线程超时导致的服务异常_java

在项目中为了提高大并发量时的性能稳定性,经常会使用到线程池来做多线程异步操作,多线程有2种,一种是实现runnable接口,这种没有返回值,一种是实现Callable接口,这种有返回值. 当其中一个线程超时的时候,理论上应该不 影响其他线程的执行结果,但是在项目中出现的问题表明一个线程阻塞,其他线程返回的接口都为空.其实是个很简单的问题,但是由于第一次碰到,还是想了一些时间的.很简单,就是因为阻塞的那个线 程没有释放,并发量一大,线程池数量就满了,所以其他线程都处于等待状态. 附上一段自己写的调

浅谈Java中的四种引用方式的区别_java

强引用.软引用.弱引用.虚引用的概念 强引用(StrongReference) 强引用就是指在程序代码之中普遍存在的,比如下面这段代码中的object和str都是强引用: Object object = new Object(); String str = "hello"; 只要某个对象有强引用与之关联,JVM必定不会回收这个对象,即使在内存不足的情况下,JVM宁愿抛出OutOfMemory错误也不会回收这种对象. 比如下面这段代码: public class Main { publi

浅谈Java中强制类型转换的问题_java

为了更好的理解我们先看下面的例子: package com.yonyou.test; import java.util.ArrayList; import java.util.Iterator; import java.util.List; /** * 测试类 * @author * @创建日期 2016-5-31 */ public class Test{ public static void main(String[] args) { List<String> list=new Array