则表达式获取字符串的重复情况需要对指定的字符串使用括号()进行分组,但不想让圆括号中的字模式匹配的文本出现在包含匹配文本的数组中,可以使用问号冒号?:
把?:放在第一个圆括号的后面就可以。
例如匹配dx在字符串中重复的情况使用/(?:dx)+/,加号表示dx出现1次或是多次
代码如下 | 复制代码 |
<?php $str='1.aadxaaa 2.bdxdxbb2bbb 3.cccc2ccc 4.dxdxdxdddddxdxdx'; preg_match_all("/(?:dx)+/",$str,$all); print_r($all); ?> 输出: Array ) |
基于知识补充
正则表达式中有一些用于重复匹配其前原子的元字符:“?”、“*”、“+”。他们主要的不同是重复匹配的次数不同。
元字符“?”表示0次或1次匹配紧接在其前的原子。例如:/colou?r/匹配“colour”或“color”。
元字符“*”表示0次、1次或多次匹配紧接在其前的原子。例如://可以匹配“
”、“”或“”等HTML标签,并且不严格的控制大小写。
元字符“+”表示1次或多次匹配紧接在其前的原子。例如:/go+gle/ 匹配“gogle”、“google”或“gooogle”等中间含有多个o的字符串。上文中提及的十六进制数字的例子,实际上更加完善的匹配表达式是/0?[ xX][0-9a-fA-F]+/,可以匹配“0x9B3C”或者“X800”等。
要准确地指定原子重复的次数,还可以使用元字符“{}”指定所匹配的原子出现的次数。“{m}”表示其前原子恰好出现m次;“{m,n}”表示其前原子至少出现m次,至多出现n次;“{m,}”表示其前原子出现不少于m次。
以下是一些示例。
/zo{1,3}m/只能匹配字符串“zom”、“zoom”、或“zooom”。
/zo{3}m/只能匹配字符串“zooom”
/zo{3,}m/ 可以匹配以 “z” 开头,“m”结束,中间至少为3个“o”的字符串。
/bo{0,1}u/可以匹配字符串“bought a butter” 中的“bou”和“bu”,起完全等价于/bo?u/。