深入分析正则表达式的子模式_正则表达式

首先,我们先看一段PHP代码:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/i";
  if(preg_match($pattern,$time,$arr)){
  echo "<pre>";
  print_r($arr);
  echo "</pre>";
  }
?>

显示结果:

Array
(
  [0] => 2012-06-23 03:08:45
)

有没有注意到,显示的结果只有一条数据,即符合匹配模式的时间格式,那如果只有一条记录的话,为什么还要用数组保存呢?直接使用字符串保存不是更好?

带着这个问题,我们来看下正则表达式中的子模式。

在正则表达式中,可以使用“(”和“)”将模式中的子字符串括起来,以形成一个子模式。将子模式视为一个整体时,那么它就相当于一个单个字符。

比如,我们将以上的代码稍微修改下,改成如下:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
  if(preg_match($pattern,$time,$arr)){
  echo "<pre>";
  print_r($arr);
  echo "</pre>";
  }
?>

注意:我只修改了$pattern,在匹配模式中,使用了括号()

执行结果:

Array
(
  [0] => 2012-06-23 03:19:23
  [1] => 2012
  [2] => 06
  [3] => 23
  [4] => 03
  [5] => 19
  [6] => 23
)

总结:我们可以使用小括号给整个匹配模式进行分组,默认情况下,每个分组会自动拥有一个组号,规则是,从左到右,以分组的左括号为标志,第一个出现的分组为组号1,第二个为组号2,以此类推。其中,分组0对应整个正则表达式。
对整个正则匹配模式进行了分组以后,就可以进一步使用“向后引用”来重复搜索前面的某个分组匹配的文本。例如:\1代表分组1匹配的文本,\2代表分组2匹配的文本等等
我们可以进一步修改下代码,如下所示:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
  $replacement = "\$time格式为:$0<BR>替换后的格式为:\\1年\\2月\\3日 \\4时\\5分\\6秒";
  print preg_replace($pattern, $replacement, $time);
  if(preg_match($pattern,$time,$arr)){
    echo "<pre>";
    print_r($arr);
    echo "</pre>";
  }
?>

注意:

因为是在双引号中,所以使用分组的时候应该使用两个反斜杠,如:\\1,而如果在单引号中,则使用一个反斜杠就可以了,如:\1
\\1用于捕获分组一种的内容:2012,\\6用于捕获分组6中的内容          
执行结果:

$time格式为:2012-06-23 03:30:31
替换后的格式为:2012年06月23日 03时30分31秒
Array
(
  [0] => 2012-06-23 03:30:31
  [1] => 2012
  [2] => 06
  [3] => 23
  [4] => 03
  [5] => 30
  [6] => 31
)

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索正则表达式
子模式
深入浅出正则表达式、深入理解正则表达式、深入浅出之正则表达式、深入正则表达式、正则表达式 贪婪模式,以便于您获取更多的相关知识。

时间: 2024-10-16 16:06:51

深入分析正则表达式的子模式_正则表达式的相关文章

Linux 正则表达式详解_正则表达式

一.linux文本查找命令 在说linux正规表达式之前,还介绍下linux中查找文本文件常用的三个命令: 1.grep : 最早的文本匹配程序,使用POSIX定义的基本正则表达式(BRE)来匹配文本. 2.egrep : 扩展式grep,其使用扩展式正规表达式(ERE)来匹配文本. 3.fgrep : 快速grep,这个版本匹配固定字符串而非正则表达式.并且是唯一可以并行匹配多个字符串的版本. 如下简单的介绍grep命令: 语法格式: grep [options ...] pattern-sp

常用正则表达式 整理篇_正则表达式

匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内): [^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) String.prototype.len=function(){ return this.replace([^\x00-\xff]/g,"aa").length; } 匹配空行的正则表达式: \n[\s|]*\r 匹配HTML标记的正则表达式: /<(.*)>.*<\/\1>

超全的js正则表达式整理笔记_正则表达式

var reCat = new RegExp("cat", "gi"); //RegExp构造函数可以带一个或两个参数,第一个参数描述需要进行匹配的模式字符串,第二个参数指定了额外的处理命令 var reCat = /cat/gi; //使用Perl风格的语法 i:执行对大小写不敏感的匹配 g:执行全局匹配(查找所有匹配而非在找到第一个匹配后停止) m:执行多行匹配 元字符  元字符是表达式语法的一部分,在正则表达式中用到的所有元字符有:{ [ ( \ ^ $ |

详解js正则表达式语法介绍_正则表达式

 本文介绍了js正则表达式,具体如下: 1. 正则表达式规则 1.1 普通字符     字母.数字.汉字.下划线.以及后边章节中没有特殊定义的标点符号,都是"普通字符".表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符.     举例1:表达式 "c",在匹配字符串 "abcde" 时,匹配结果是:成功:匹配到的内容是:"c":匹配到的位置是:开始于2,结束于3.(注:下标从0开始还是从1开始,因当前编程语言

比较全面的C 、Java、JavaScript中的正则表达式详解_正则表达式

什么是正则表达式? 正则表达式(Regular Expression) 就是用某种模式去匹配一类字符串的公式.如你要在一篇文章中查找第一个字是"罗"最后一个字是"浩"的三个字的姓名,即"罗 * 浩":那么"罗 * 浩"就是公式,也称作 模式(Pattern) ,这篇文章就是 要匹配的串( 或叫文本 text) .再如,你要检查输入的一个字符串是否是 126 邮箱的格式,你得制定一个规则去查检,这种规则就是正则表达式. 从入门开

Java正则表达式学习教程_正则表达式

本教程旨在帮助你驾驭Java正则表达式,同时也帮助我复习正则表达式. 什么是正则表达式? 正则表达式定义了字符串的模式.正则表达式可以用来搜索.编辑或处理文本.正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别.Java正则表达式和Perl的是最为相似的. Java正则表达式的类在 java.util.regex 包中,包括三个类:Pattern,Matcher 和 PatternSyntaxException. Pattern对象是正则表达式的已编译版本.他没有任何公共构造器,我们通

php的正则表达式完全手册_正则表达式

复制代码 代码如下: (?:pattern) 匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用.这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用.例如, 'industr(?:y|ies) 就是一个比 'industry|industries' 更简略的表达式. (?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串.这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用.例如,'Window

日常收集整理php正则表达式(超常用)_正则表达式

以下是关于小编给大家日常收集整理php正则表达式,具体内容请看下文详解吧 $str = preg_replace("/(<a.*?>)(.*?)(<\/a>)/", '\1<span>\2</span>\3', $str); 其中用了三个子模式(每个圆括号中内容为一个子模式),第一个是链接开始标签,第二个是链接文本,第三个是</a> 然后第二个参数中\1.\2.\3就表示这三个部分,要替换成什么样子还不简单? 获取页面中的所有

最常用的PHP正则表达式收集整理_正则表达式

PHP代码 $str = preg_replace("/(<a.*?>)(.*?)(<\/a>)/", '\1<span class="link">\2</span>\3', $str); 其中用了三个子模式(每个圆括号中内容为一个子模式),第一个是链接开始标签,第二个是链接文本,第三个是</a> 然后第二个参数中\1.\2.\3就表示这三个部分,要替换成什么样子还不简单? 获取页面中的所有链接地址的PHP