正则表达式,林林总总说了几篇,还是有不少的内容需要补充。
-->星号
字符出现0次或者多次
$ echo "ik"|sed -n '/e*/p'
ik
$ echo "ieek"|sed -n '/e*/p'
ieek
$ echo "This is a color TV"|sed -n '/colou*r/p' --colour中的u可以出现0次或者多次。出现0次的时候color就符合条件
This is a color TV
$ echo "This is a colour TV"|sed -n '/colou*r/p' --colour中的u可以出现0次或者多次。出现1次的时候colour就符合条件
This is a colour TV
-->星号+点字符
星号和点字符的结合
$ echo "This is a nice hat"|sed -n '/a.*hat/p'
This is a nice hat
-->星号+字符组
$ cat c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat
$ sed -n '/b[ae]*t/p' c.txt
bt
bat
bet
btt
batt
baaeeat
扩展表达式有以下几种,在linux中对于grep,awk都是支持的。
问号
花括号
管道符号
聚合表达式
-->问号
字符出现0次或者1次
$ cat c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat
$ sed -n '/b[ae]*t/p' c.txt
bt
bat
bet
btt
batt
Baaeeat
$ awk '/b[ae]?t/{print $0}' c.txt --匹配0次或者1次的时候,Baaeeat 怎么也匹配不到[ae]相关的组合。
bt
bat
bet
btt
batt
-->加号
字符出现1次或者多次,这个和问号有些类似。但是对于出现的频率会有不同。问号是0次或者一次,星号是0次或者多次。
$ awk '/b[ae]+t/{print $0}' c.txt
bat
bet
batt
baaeeat
-->花括号
m 正则表达式准确出现m次
m,n 正则表达式至少出现m次,至多n次
默认awk不会识别正则表达式区间,需要指定--re-interval 选项
$ echo "bat"|awk '/b[ae]{1}t/{print $0}'
echo "bat"|awk --re-interval '/b[ae]{1}t/{print $0}'
bat
$ cat c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat
$ awk --re-interval '/b[ae]{1,2}t/{print $0}' c.txt
bat
bet
batt
$ cat d.txt
the cat is asleep
the dog is asleep
the sheep is asleep
$ awk '/cat|dog/{print $0}' d.txt
the cat is asleep
the dog is asleep
-->聚合表达式
$ echo "Sat"|awk '/Sat(urday)?$/{print $0}'
Sat
$ echo "Satx"|awk '/Sat(urday)?$/{print $0}'
$ echo "Saturday"|awk '/Sat(urday)?$/{print $0}'
Saturday
$ echo "Saturdayurday"|awk '/Sat(urday)?$/{print $0}'
$ echo "cat"|awk '/(c|b)a(b|t)/{print $0}'
cat
$ echo "tab"|awk '/(c|b)a(b|t)/{print $0}‘
$ echo "tac"|awk '/(c|b)a(b|t)/{print $0}'