在第一篇中介绍了关于纯文本和特殊字符在正则表达式中的应用,来看看其它的一些相关的点。
--关于锚定
锚定就跟大家在开发网页的时候使用的锚定是一个意思,其实就是给一段字符做个标识。对于行首使用是^,对于行尾使用时$,可能大家并不陌生。
锁定在行首
$ echo "The book store" |sed -n '/^book/p' --这个命令没有输出,是因为锚定不在行首。
$ echo "Books are great"|sed -n '/^Book/p' --这个输出可以得到,锚定在行首。
Books are great
$ cat a.txt
this is a test
this is good
cat a.txt |sed -n '/^this/p' --这个测试的例子也是类似,可以按行查找,找到每行以this开头的语句。
this is a test
this is good
对于字符^,如果只是代表普通的字符,就需要使用转义来实现,要不都会按照锚定字符来处理。
$ echo "This ^ is a test" |sed -n '/s ^/p'
This ^ is a test
$ echo "^This is a test"|sed -n '/^/p'
^This is a test
$ echo "^This is a test"|sed -n '/^Th/p‘ --这个例子里面,会查找以This开头的部分,所以没有输出
$ echo "^This is a test"|sed -n '/\^Th/p'
^This is a test
锚定在行尾
锚定在行尾和行首的结果相反,但表达的含义是类似的。
$ echo "This is a good book"|sed -n '/book$/p' --这个命令查找输出以book结尾的字符
This is a good book
$ echo "This book is good"|sed -n '/book$/p' --因为这个字符不是以book结尾,所以没有输出
$echo "There are a lot of books"|sed -n '/book$/p‘ --这个因为字符不是以book结尾,也没有输出
组合锚点,这个可能在使用的时候更有意义,把行首锚定和行尾锚定结合起来。其实在很多时候还是很有用的。
$ cat a.txt
I said this is test
this is a test
this is good
This is great
$ sed -n '/^this is good$/p' a.txt --这个命令输出以this开头以good结尾的部分,只有字符this is good输出了。
this is good
$ sed –n ‘/^$/d’ a.txt –去除空白行,这个可能是锚定使用场景最多的例子了。
--点字符
点字符对于正则表达式也是很重要的一个部分,和*的一个区别是点字符要求至少有一处匹配。
看下面的例子,a.txt的内容如下,希望能够找到每行符合.at的模式,小数点在这个地方要求至少有一处匹配。像最后一行以at开头就会排除掉。
$ cat a.txt
this is a test of line
The cat is sleeping
that is a very good book
i am at home
at this time
$ sed -n '/.at/p' a.txt --输出的结果如下,5行数据输出了3行。
The cat is sleeping
that is a very good book
i am at home