shell也可以使用正则分组捕获,不过不能使用 $1或\1这样的形式来捕获分组,可以通过数组${BASH_REMATCH}来获得,如${BASH_REMATCH[1]},${BASH_REMATCH[N]}
下面以ip="121.0.2.2"为例,shell脚本代码如下(当然,你要做成更通用交互式的脚本,可以通过expect来实现):
#!/bin/bash
ip="121.0.2.2"
if [[ $ip =~ ^([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]{1,2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])$ ]]
then
echo "Match"
echo ${BASH_REMATCH[1]}
echo ${BASH_REMATCH[2]}
echo ${BASH_REMATCH[3]}
echo ${BASH_REMATCH[4]}
else
echo "Not match"
fi
shell脚本正则匹配文件中的Email并记录到文件
#! /bin/bash
function read_file(){
for line in `cat $1`
do
if [ `echo $line |grep "^[a-zA-Z0-9_-]*@[A-Za-z_-]*\.[a-zA-Z_-]*$"` ];then
echo $line >> result.txt
else
echo "---" >> result.txt
fi
done
}
#eg
read_file a.txt
常用的shell正则表达式
^USER$ 匹配只包含USER的行
[tty]$ 匹配以tty结尾的行
\. 匹配带句点的行
^d..x..x..x 匹配用户、用户组及其他用户组成员有可执行权限的目录
^[^l] 匹配排除关联目录的目录列表
[.*0] 匹配0之前或之后加任意字符
[^$] 匹配空行
[^.*$] 匹配匹配行中任意字符串
^......$ 匹配包括6个字符的行
[a-zA-Z] 匹配任意单字符
[a-z][a-z]* 匹配至少一个小写字母
[^0-9\$] 匹配非数字或美元标识
[^0-0A-Za-z] 匹配非数字或字母
De..ce 匹配前两个字母为De,后跟两个任意字符,最后为ce
[1..9] 匹配匹配1到9
^.$ 匹配仅有一个字符的行
^\.[0-9][0-9] 匹配以一个句点和两个数字开始的行
'"Device"' 匹配单词device
De[Vv]ice\. 匹配单词Device或deVice
[0-9]\{2\}-[0-9]\{2\}-[0-9]\{4\} 匹配日期格式dd-mm-yyyy
[^.*$] 匹配匹配任意行
^[1-9]\d{5}$ 匹配邮政编码
((\+?[0-9]{2,4}\-[0-9]{3,4}\-)|([0-9]{3,4}\-))?([0-9]{7,8})(\-[0-9]+)?$/ 匹配电话号码
((\(\d{2,3}\))|(\d{3}\-))?13\d{9}$ 匹配手机号码
(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$” 匹配IP地址
[\u4e00-\u9fa5] 匹配中文字符的正则表达式
[^\x00-\xff] 匹配双字节字符(包括汉字在内)
\n[\s| ]*\r 匹配空行的正则表达式
/<(.*)>.*<\/\1>|<(.*) \/>/ 匹配HTML标记的正则表达式
(^\s*)|(\s*$) 匹配首尾空格的正则表达式
\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 匹配Email地址的正则表达式
^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$ 匹配网址URL的正则表达式
^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)
(\d{3}-|\d{4}-)?(\d{8}|\d{7})? 匹配国内电话号码
^[1-9]*[1-9][0-9]*$ 匹配腾讯QQ号