1. \b:表示单词的开头或者结尾,可能是空格、标点符号或者换行,但是\b不匹配其中的任何一个,这是指代这些元素中的任一个位置。
示例:\bhi\b:查找文本中所有的“hi”单词,但是不包括him、history等字样
1.1 ^:匹配字符串的开始,特指一个段落的起始。
1.2 $:匹配字符串的结束。特指一个段落的结尾,这两个都是\b的子集。
重复:
2. *:表示*前面的内容重复出现任意多次,".*"连在一起就表示任意数量的不包含换行符的字符。
示例:\bhi\b.*\bLucy\b:先是一个hi,然后任意多个字符(但不能有回车),最后是一个单独的单词Lucy。
2.1 +:同样表示数量,但是+必须是1次或以上,不包括0次,而*是指任意数量,包括0次重复。
2.2 {n}:数量控制,前方的字符精确重复n次。
2.3 {n,m}:数量控制,前方的字符重复n到m次,n<=m。
2.4 ?:重复0次或1次。
3. .: 表示任意字符,不包含回车换行。
4. \d:匹配任意的数字(0,1,2……9)
示例:0\d\d-\d{7}:查找以0开头,后两个是数字,然后是一个连字符"-",接着是7个数字的字符串,如:025-8224110。
5. \s:匹配任意的空白符,包括空格、制表符(tab键)、换行符、中文全角空格等。
6. \w:匹配字母、数字、下划等。
示例1:\ba\w*\b:匹配以字母"a"开头,然后是任意多个任意字符不包括空格等空白符,然后一个单词结束符。其意义就是以a开头的所有单词。
示例2:\b\w{6}\b:匹配正好是6个字符长度的单词。
7. []:任意匹配一个方括号中存在的字符。
示例:[abc]\w{4}\b:以a、b、c中的任意一个字符为开头,后面有4个字母的单词。
反义
8. \D \S \W \B 这些元字符的大写形式分别表示他们表示的集合的反义。
示例:\D:表示不是数字的所有字符,如:abced
8.1 [^x]:表示不是x字符的所有字符
8.2 [^xyz]:表示不是x、y、z中任一种的字符
9.替换
"|":使用"|"符号可以实现逻辑或运算,配合小括号"()"的使用,可以实现不同条件的或运算。
10分组
"()":用括号包围住已经实现的表达式,可以方便的继续使用重复、替换等操作。
示例:\b(\w+\b\s+)\1+\b:将第一次出现的括号表达式用\1表示,可以匹配go go go
自学到这里已经非常不错了,下面继续研究正则表达式的高级属性
断言:
(?=express)这是一种假定条件,可以放在表达式的后方,已验证前方的字符后面的表达式是否为express,但是并不包含后方的express。
示例:\b\w*(?=ing\b):取得后缀为ing的所有单词的前缀。
(?<=express)前置断言,放于表达式首部,已验证字符串前方的表达式是否符合express,同样也不包含express本身。
示例:(?<=\bre)\w*\b:取得所有前缀为re的单词的后面部分
注释:
(?#)以这种形式来注释正则表达式。
示例:2[0-4]\d(?#200-249)
懒惰模式匹配
*:匹配最多的字符
*?:匹配最少的字符
又一篇正则表达式学习笔记
时间: 2024-10-02 17:40:06
又一篇正则表达式学习笔记的相关文章
又一篇正则表达式学习笔记_正则表达式
1. \b:表示单词的开头或者结尾,可能是空格.标点符号或者换行,但是\b不匹配其中的任何一个,这是指代这些元素中的任一个位置. 示例:\bhi\b:查找文本中所有的"hi"单词,但是不包括him.history等字样 1.1 ^:匹配字符串的开始,特指一个段落的起始. 1.2 $:匹配字符串的结束.特指一个段落的结尾,这两个都是\b的子集. 重复: 2. *:表示*前面的内容重复出现任意多次,".*"连在一起就表示任意数量的不包含换行符的字符. 示例:\bhi\b
js正则表达式学习笔记_正则表达式
正则表达式:对字符串中的信息实现查找.替换和提取操作.(不支持注释和空白,必须写在一行内)正则表达式的创建:包含在一对斜杠之间的字符(直接量语法) 例如: var pattern = /s$/; // 创建一个正则来匹配所有以字母s结尾的字符串,并赋值给pattern 一 .字符类将直接量字符单独放进方括号内就组成了字符类. 一个字符类可以匹配它所包含的任意字符.正则表达式的字符类:[...] 方括号内的任意字符[^...] 不在方括号内的任意字符. 除换行符
php正则表达式学习笔记_php技巧
php正则表达式学习笔记分享: 1.创建正则表达式 $regex = '/\d/i'; 与JavaScript中的第一个方式有点像,只是这里的话是个字符串. 2.正则表达式中的特殊字符 特殊字符有: . \ + * ? [ ^ ] $ ( ) { } = ! < > | : - 3.正则表达式中的函数 有8个方法,preg_match与preg_match_all,preg_replace与preg_replace_callback,preg_grep.preg_split.preg_l
正则表达式学习笔记_正则表达式
正则表达式学习笔记 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含 有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等. 列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的* 的含义是不同的. 为便于理解和记忆,先从一些概念入手,所有特殊字符或字符组合有一个总表在后面,最后一 些例子供理解相应的概念. 正则表达式 是由普通字符(例如字符 a 到 z)以及特殊字符(
js正则表达式学习笔记
正则表达式:对字符串中的信息实现查找.替换和提取操作.(不支持注释和空白,必须写在一行内) 正则表达式的创建:包含在一对斜杠之间的字符(直接量语法) 例如: var pattern = /s$/; // 创建一个正则来匹配所有以字母s结尾的字符串,并赋值给pattern 一 .字符类 将直接量字符单独放进方括号内就组成了字符类. 一个字符类可以匹配它所包含的任意字符. 正则表达式的字符类: [...] 方括号内的任意字符 [^...] 不在方括号内的任意字符 .
python正则表达式学习笔记
就个人而言,主要用它来做一些复杂字符串分析,提取想要的信息 学习原则:够用就行,需要的时候在深入 现总结如下: 正则表达式中特殊的符号: "." 表任意字符 "^ " 表string起始 "$" 表string 结束 "*" "+" "?" 跟在字符后面表示,0个--多个, 1个--多个, 0个或者1个 *?, +?, ?? 符合条件的情况下,匹配的尽可能少//限制*,+,?匹配的贪婪性
java正则表达式学习笔记之命名捕获_java
很多正则引擎都支持命名分组,java是在java7中才引入这个特性,语法与.Net类似(.Net允许同一表达式出现名字相同的分组,java不允许). 命名分组很好理解,就是给分组进行命名.下面简单演示一下java中如何使用以及注意事项. 1.正则中定义名为NAME的分组(?<NAME>X) 这里X为我们要匹配的内容,注意,在这个命名不能重复,名字也不能以数字开头! 2.反向引用NAME组所匹配到的内容\k<NAME> 注意,反向引用是针对组所匹配到的内容,而非组的表达式. 3.替换
JavaScript正则表达式学习笔记与常用正则总结
一.RegExp ECMAScript通过RegExp类型类支持正则表达式,语法和Perl类似: var exp = /pattern/flags; patternb部分是任何简单的或复杂的正则表达式:flags是每个正则表达式所带的一个或者多个标志. 正则表达式的模式匹配支持三个标志: g:全局模式,即模式应用于整个字符串,而非在发现第一个匹配项时立即停止 i:不区分大小写模式 m:多行模式,即到达一行文本末尾是还会继续茶查找下一行中是否存在与模式匹配的项. 1.创建正则表达式 JavaScr
JS前端正则表达式学习笔记(转)
1.正则表达式的创建: 方法一:以字面量形式来创建 格式为/pattern/flags;其中pattern(模式)为任何简单或者复杂的表达式,可以包括字符类,限定符,分组,向前查找以及反向引用.每个正则表达式都可以有一个或者多个标识(flags),用以表明表达式的行为.正则表达式的匹配模式支持下列三个标识: g:(global) 全局模式,即模式将应用于所有的字符串,而非发现第一个匹配项时立即停止: i: (case-insensitive) 表示不区分大小写模式 m: (multiline)表