sed流编辑器是shell中处理文本内容的一大利器。sed命令从文本流中读取一行文本到模式空间中进行相应的命令、或脚本处理,因此在处理换行符时会有点特殊。
下面的命令可以很正确的执行:
代码如下 | 复制代码 |
echo "a,b,c,d" |sed 's/,/n/g' |
但是如果我想恢复回来,下面的命令却没有效果了:
代码如下 | 复制代码 |
echo "a,b,c,d" |sed 's/,/n/g'|sed 's/n/,/g' |
这跟sed的行处理方式有关,sed读取一行时,会先把换行符去掉,处理完后再添加上,所以是无法使用上面的命令进行换行符替换的,必须使用sed中的其它命令来完成。上面的恢复可以使用tr命令:
代码如下 | 复制代码 |
echo "a,b,c,d" |sed 's/,/n/g'|tr -t 'n' ',' |
下面是网上找到的一些用法,经实践效果是各不相同的,只有一种是完全可行的。
代码如下 | 复制代码 |
sed ':label;N;s/n/:/;b label' filename sed ':label;N;s/n/:/;t label' filename |
上面的两条命令可以实现将文件中的所有换行符替换为指定的字串,如命令中的冒号。命令的解释:
◦:label; 这是一个标签,用来实现跳转处理,名字可以随便取(label),后面的b label就是跳转指令
◦N; N是sed的一个处理命令,追加文本流中的下一行到模式空间进行合并处理,因此是换行符可见
◦s/n/:/; s是sed的替换命令,将换行符替换为冒号
◦b label 或者 t label b / t 是sed的跳转命令,跳转到指定的标签处
标签跳转和N的追加命令实现了每一行的不间断放入模式处理空间,从而不会漏掉每一个换行符,而没有标签的话跳转的话,就只能每两行替换掉一个换行符,对比效果:
代码如下 | 复制代码 |
$ echo "a,b,c,d" |sed 's/,/n/g'|sed ':x;N;s/n/,/;b x' a,b,c,d $ echo "a,b,c,d" |sed 's/,/n/g'|sed 'N;s/n/,/' a,b c,d |
还有如下的一种命令的处理效果,也是无法实现换行符的替换。事实上$符号在sed中表示文本流中的最后一行,下面的处理结果我并不是很理解。
代码如下 | 复制代码 |
$ echo "a,b,c,d" |sed 's/,/n/g'|sed 's/$/,/' a, b, c, d, |
PS:sed中的n命令和~地址表示
代码如下 | 复制代码 |
sed '8,80{n;n;n;d}' filename |
n表示读取文本流中的下一行到模式空间(N为追加),sed还是只处理一行。上面的命令理解:从第8行起(包含),一次读取9/10/11行,然后读取11行后,执行d命令,就是删除处理空间中的第11行,之后从12行开始,读取13/14/15, 删除15行,以此类推,直到第80行。
代码如下 | 复制代码 |
sed '11~4d' filename |
该命令实现和上一个命令同样的功能,唯一的差别就是它直到文件结束,而无法指定结束行。
代码如下 | 复制代码 |
sed -i -e ':x;N;s/n/ /;b x' user_uniq.txt |
实现将换行替换成空格