PHP 正则表达式函数库(两套)

在PHP中有两套正则表达式函数库,两者功能相似,只是执行效率略有差异:

一套是由PCRE(Perl Compatible Regular Expression)库提供的。使用“preg_”为前缀命名的函数;

一套由POSIX(Portable Operating System Interface of Unix )扩展提供的(PHP默认)。使用以“ereg_”为前缀命名的函数;

PHP中,正则表达式有三个作用:

匹配,也常常用于从字符串中析取信息。

用新文本代替匹配文本。

将一个字符串拆分为一组更小的信息块。

一个正则表达式中至少包含一个原子。

原子(普通字符,如英文字符)

元字符(有特殊功用的字符)

模式修正字符(对正则表达式语义的修正)

原子(Atom)

单个字符、数字,如a~z,A~Z,0~9。

模式单元,如(ABC)可以理解为由多个原子组成的大的原子。

原子表,如 [ABC]。

重新使用的模式单元,如:\\1

普通转义字符,如:\d, \D, \w

转义元字符,如:\*,\.

POSIX正则表达式

POSIX正则表达式全称为Portable Operating System Interface of Unix,意为UNIX可移植操作系实现接口。

构造POSIX正则表达式的方法和创建数学表达式的方法一样,也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。

元字符(Meta-character)

元字符是用于构造规则表达式的具有特殊含义的字符。如果要在正则表达式中包含元字符本身,必须在其前加上”\”进行转义

元字符 说明

* 0次、1次或多次匹配其前的原子

+ 1次或多次匹配其前的原子

? 0次或1次匹配其前的原子

| 匹配两个或多个选择 列如 [1-9]|[a-b]|[A-Z] 与其中任何匹配为ture

^ 匹配字符串串首的原子 例如 abscd===^afdgfgf 相匹配

$ 匹配字符串串尾的原子 例如 dasdsv===v$

[] 匹配方括号中的任一原子 例如 s===[dsadas]

[^] 匹配除方括号中的原子外的任何字符 例如 aaaaa===[dddd]

{m} 表示其前原子恰好出现m次

{m,n} 表示其前原子至少出现m次,至少出现n次(n>m)

{m,} 表示其前原子出现不少于m次

() 整体表示一个原子

. 匹配除换行之外的任何一个字符

^ $ 这两个原字符在一起称为定界

abd===^abc$ 只有这样才匹配

模式匹配的顺序

顺序 元字符 说明

1 () 模式单元

2 ?* +{} 重复匹配

3 ^$ 边界限制

4 | 模式选择

POSIX正则表达式函数

ereg()和eregi()

ereg_replace()和eregi_replace()

split()和spliti()

ereg()和eregi()ereg()字符串匹配函数,eregi()是ereg()函数的忽略大小的版本

语法格式:if (!ereg('^[^./][^/]*$', $userfile))//不匹配格式输出die

{

die('这是一个非法的文件名!');

}

ereg_replace()和eregi_replace(忽略大小写)替换

string eregi_replace (“正则表达式”,“目标替换字符”,“替换目标”)

语法格式:$string = "This is a test";

echo str_replace(" is", " was", $string);

echo ereg_replace("( )is", "\\1was", $string);\\1 为继承第一个整体

echo ereg_replace("(( )is)", "\\2was", $string);\\2继承第二个整体

split()和spliti(忽略大小写)用正则表达式将字符串分割到数组中

list:给数组中的值赋予一些变量

语法格式:$date = "04/30/1973";

list($month, $day, $year) = split ('[/.-]', $date);//列出三个变数对应格式//以什么形式拆分 拆分谁

echo "Month: $month; Day: $day; Year: $year<br />

";

输出结果Month: 04; Day: 30; Year: 1973

多行匹配

$rows = file('php.ini'); //将php.ini文件读到数组中

//循环便历

foreach($rows as $line)

{

if(trim($line))

{

//将匹配成功的参数写入数组中

if(eregi("^([a-z0-9_.]*) *=(.*)", $line, $matches)) //循环进行多行匹配

{

$options[$matches[1]] = trim($matches[2]);

}

unset($matches);

}

}

//输出参数结果

print_r($options);

PCRE正则表达式

PCRE全称为Perl Compatible Regular Expression,意思是Perl兼容正则表达式。

在PCRE中,通常将模式表达式(即正则表达式)包含在两个反斜线“/”之间,如“/apple/”。

元字符(Meta-character)

元字符 说明

\A 匹配字符串串首的原子

\Z 匹配字符串串尾的原子

\b 匹配单词的边界 /\bis/ 匹配头为is的字符串 /is\b/ 匹配尾为is的字符串 /\bis\b/ 定界

\B 匹配除单词边界之外的任意字符 /\Bis/ 匹配单词“This”中的“is”

\d 匹配一个数字;等价于[0-9]

\D 匹配除数字以外任何一个字符;等价于[^0-9]

\w 匹配一个英文字母、数字或下划线;等价于[0-9a-zA-Z_]

\W 匹配除英文字母、数字和下划线以外任何一个字符;等价于[^0-9a-zA-Z_]

\s 匹配一个空白字符;等价于[\f

\t\v]

\S 匹配除空白字符以外任何一个字符;等价于[^\f

\t\v]

\f 匹配一个换页符等价于 \x0c 或 \cL

匹配一个换行符;等价于 \x0a 或 \cJ

匹配一个回车符等价于\x0d 或 \cM

\t 匹配一个制表符;等价于 \x09\或\cl

\v 匹配一个垂直制表符;等价于\x0b或\ck

\oNN 匹配一个八进制数字

\xNN 匹配一个十六进制数字

\cC 匹配一个控制字符

模式修正符(Pattern Modifiers)

i -可同时匹配大小写字母

M -将字符串视为多行

S -将字符串视为单行,换行符做普通字符看待,使“.”匹配任何字符

X -模式中的空白忽略不计

U -匹配到最近的字符串

e -将替换的字符串作为表达使用

格式:/apple/i匹配“apple”或“Apple”等,忽略大小写。 /i

PCRE的模式单元

//1 提取第一位的属性

/^\d{2}([\W])\d{2}\\1\d{4}$匹配“12-31-2006”、“09/27/1996”、“86 01 4321”等字符串。但上述正则表达式不匹配“12/34-5678”的格式。这是因为模式“[\W]”的结果“/”已经被存储。下个位置“\1”引用时,其匹配模式也是字符“/”。

当不需要存储匹配结果时使用非存储模式单元“(?:)”

例如/(?:a|b|c)(D|E|F)\\1g/ 将匹配“aEEg”。在一些正则表达式中,使用非存储模式单元是必要的。否则,需要改变其后引用的顺序。上例还可以写成/(a|b|c)(C|E|F)\2g/。

PCRE正则表达式函数

preg_match()和preg_match_all()

preg_quote()

preg_split()

preg_grep()

preg_replace()

preg_match()和preg_match_all()正则表达式的匹配

语法格式:if (preg_match ("/php/i", "PHP is the web scripting language of choice.")) {

print "A match was found.";

} else {

print "A match was not found.";

}

preg_quote()转义正则表达式字符

语法格式:$keywords = "$40 for a g3/400";

$keywords = preg_quote ($keywords, "/");//转义谁 /转义符号

echo $keywords;

preg_split()用正则表达式分割字符串

preg_split()本函数与split函数功能一致。

语法格式:$keywords = preg_split ("/[\s,]+/", "hypertext language, programming");

print_r($keywords);

preg_grep()返回与模式匹配的数组单元

语法格式:$fl_array = preg_grep ("/^(\d+)?\.\d+$/", $array);

preg_replace()执行正则表达式的搜索和替换

语法格式:

复制代码 代码如下:

$string = "April 15, 2003";

$pattern = "/(\w+) (\d+), (\d+)/i";

$replacement = "\${1}1,\$3";

print preg_replace($pattern, $replacement, $string);

preg_match_all()进行全局正则表达式匹配

语法格式:

复制代码 代码如下:

preg_match_all ("|<[^>]+>(.*)</[^>]+>|U",

"<b>example: </b><div align=left>this is a test</div>",

$out, PREG_PATTERN_ORDER);

print $out[0][0].", ".$out[0][1]."

";

print $out[1][0].", ".$out[1][1]."

";

输出结果:<b>example: </b>, <div align=left>this is a test</div> example: , this is a test

时间: 2024-08-01 06:49:12

PHP 正则表达式函数库(两套)的相关文章

PHP 正则表达式函数库(两套)_正则表达式

在PHP中有两套正则表达式函数库,两者功能相似,只是执行效率略有差异: 一套是由PCRE(Perl Compatible Regular Expression)库提供的.使用"preg_"为前缀命名的函数: 一套由POSIX(Portable Operating System Interface of Unix )扩展提供的(PHP默认).使用以"ereg_"为前缀命名的函数: PHP中,正则表达式有三个作用: 匹配,也常常用于从字符串中析取信息. 用新文本代替匹配

.Net开放源码工程之二---正则表达式函数库

函数|正则     我想大家已经知道正则表达式在编程中的应用,在作为字符串处理.数据合法性校验上都有其快速.独到的作用,但是由于正则表达式的复杂性,这也是很多程序员在应用时候学习最困难的地方,下面这个网站提供一个开放源码的正则表达式学习,应该对大家有所帮助正则表达式函数库 附注:    在.Net中提供一个封装好的System.Text.RegularExpressions可以使用正则表达式 我这里对其提供的一部校验分函数做一个简单的描述:1.校验E-Mail地址的数据合法性正则表达式^(([^

浅析PHP正则表达式函数库

本文向你介绍了PHP正则表达式函数库(POSIX 扩展)greedy匹配,我们要注意,在条件子模式以及其它许多 POSIX 扩展正则表达式语法中那些所不被不支持的特性. PHP正则表达式函数库学习中的警告: 本类正则表达式并不能安全用于二进制模式.PCRE 函数库则可以.正则表达式在 PHP 中用来做复杂的字符串操作.支持正则表达式的函数为: ◆ereg() ◆ereg_replace() ◆eregi() ◆eregi_replace() ◆split() ◆spliti() 这些函数都接受一

动态网页技术:ASP函数库

动态|函数|网页 ASP函数库<%''''                   函数目录                    ''''''''-----------------------------------------------'''''''' 函数ID:0001[截字符串]                        '''''''' 函数ID:0002[过滤html]                        '''''''' 函数ID:0003[打开任意数据表并显示表结构及

网络安全工具开发函数库介绍

---[[ 前言 ]]-------------------------------------------- 本文主要介绍几个在UNIX系统平台上开发网络安全工具时最常用的library.此外还提供一些如何使用这些开发库进行网络安全工具开发的设计框架和流程.希望能和对网络安全工具开发有兴趣的朋友共同交流,互相促进. 众所周知,基于socket的网络编程已成为当今不可替代的编程方法.这种编程思想将网络通讯当作"文件"描述字进行处理,对这个"网络文件"(即 socke

asp制作中常用到的函数库集合第1/8页_ASP基础

ASP函数库    <%    '''' 函数目录 ''''    ''''-----------------------------------------------''''    '''' 函数ID:0001[截字符串] ''''    '''' 函数ID:0002[过滤html] ''''    '''' 函数ID:0003[打开任意数据表并显示表结构及内容]''''    '''' 函数ID:0004[读取两种路径] ''''    '''' 函数ID:0005[测试某个文件存在否] 

Web---JSTL(Java标准标签库)-Core核心标签库、I18N国际化、函数库

前面为JSTL中的常用EL函数,后面的为具体演示实例! JSTL简介: JSTL(Java Standard Tag Library) –Java标准标签库. SUN公司制定的一套标准标签库的规范. JSTL标签库,是由一些Java类组成的. JSTL组成: JSTL –Core 核心标签库. 重点 JSTL – I18N - 国际化标签库.Internationalization- I18N JSTL – SQL – 数据库操作标签(有悖于MVC设计模式),现在都不用这个. JSTL - Fu

asp制作中常用到的函数库集合第1/8页

ASP函数库    <%    '''' 函数目录 ''''    ''''-----------------------------------------------''''    '''' 函数ID:0001[截字符串] ''''    '''' 函数ID:0002[过滤html] ''''    '''' 函数ID:0003[打开任意数据表并显示表结构及内容]''''    '''' 函数ID:0004[读取两种路径] ''''    '''' 函数ID:0005[测试某个文件存在否] 

php BC高精确度函数库

$right 返回 1 *$scale 小数点位数 *************************************************************************************** $a = 4.45; $b = 5.54; if(bccomp($a, $b, 2) == 0) { } ***********************************************************************************