一天一个shell命令 文本操作系列-comm命令用法_linux shell

 comm命令比较两个已排序文件每行数据的差异,并将其结果显示出来,如果没有指定任何参数,comm命令读取这两个文件,然后生成三列输出:1>仅在file1中出现的行2>仅在file2中出现的行3>在两个文件中都存在的行。
  如果为文件名之一指定 -(减号),则 comm 命令会从标准输入设备读取数据。

题外话:说到比较文件,过来人都用过Beyond Compare,老版本时候,我们只能右键选中用于比较的文件,再选中被比较文件,对比。 如今他有了丰富的界面,支持linux上比较文件。 干什么用的?svn管理不善的时候,版本控制做的不好的时候,你就会期望他了。这都是经验- -!

回到正题:在shell中,也有个这么个命令---comm。 comm可用于两个文件之间的比较。可以用于文件的比较,交集,求差以及差集操作。

这个定义其实不够详细,应该是 comm逐行比较已排序的文件1和文件2.

全称:

(惭愧)没有找到合适的全称。 com 很明显是compare开头,m为mode。望高手指正。

查看—help

用法:comm [选项]... 文件1 文件2
逐行比较已排序的文件文件1 和文件2。

如果不附带选项,程序会生成三列输出。第一列包含文件1 特有的行,第二列包含 文件2 特有的行,而第三列包含两个文件共有的行。

  -1        不输出文件1 特有的行
  -2        不输出文件2 特有的行
  -3        不输出两个文件共有的行

  --check-order            检查输入是否被正确排序,即使所有输入行均成对
  --nocheck-order        不检查输入是否被正确排序
  --output-delimiter=STR    依照STR 分列

 解读:

1. --check-order

该命令默认情况下  如果希望不检验排序,可以--nocheck-order。

 2. --output-delimiter=STR

 STR 就是个表达式。 可以是任何非特殊字符

3. -1,-2

  可以写成 -12 与普通命令用起来一样

  实例:

1.建立A.txt

加入元素

apple
 orange
 gold
 silver
 steel
 iron

2. 建立B.txt

加入元素

orange
 gold
 cookies
 carrot

可以尝试直接比较: comm A.txt B.txt

你会发现提示一个错误,没有排序。

3. 排序

复制代码 代码如下:

sort A.txt -o A.txt; sort B.txt -o B.txt

4. 比较

复制代码 代码如下:

$comm A.txt B.txt

复制代码 代码如下:

apple  
      carrot  
      cookies  
                gold  
iron  
                orange  
silver  
steel

结果实际为3列 其中第一列是文件1特有 -1表示删除第一列

第二列是文件2特有的  -2代表删除第二列
第三列代表共同有的  -3代表删除共有的列

4.1 打印交集:

$comm –12 A.txt B.txt

4.2 打印两个文件中不同的行

$comm –3 A.txt B.txt

补充个小修改,两列不好看,用sed删除行首的\t

$comm –3 A.txt B.txt | sed 's/^\t//'

实战:

  comm在实战中,只会在一些非常特殊的场景中用到。 比较简单,就不举例了。(笔者遇到的场景中,仍然坚持有更好的方案时候,不用这个命令,呵呵)。

本文出自 “书生” 博客

时间: 2024-08-27 14:37:31

一天一个shell命令 文本操作系列-comm命令用法_linux shell的相关文章

一天一个shell命令 linux文本操作系列-touch命令用法_linux shell

之前我们学过dd创建测试文件,如果不需要考虑文件大小,创建一个空白文件的话,不妨试试 touch: 将每个文件的访问时间和修改时间改为当前时间. 不存在的文件将会被创建为空文件,除非使用-c 或-h 选项. 入门例子: 1. 如果想生成100个空文件 for name in {1..100}.txt do touch $name done 2. 改进一下 touch test{1..20}.c 查看 --help 用法:touch [选项]... 文件... 将每个文件的访问时间和修改时间改为当

一天一个shell命令 文本操作系列-linux dd使用教程_linux shell

今天第一天写,先说下写shell脚本的基本知识 1. shell脚本以.sh 为扩展名,通常运行 ./${filename}.sh 或者 sh ${filename}.sh 2. shell 脚本开头以 #!/bin/bash #!读作 "shebang" 3. 开启调试  #!/bin/bash –xv 4. /dev/null 任何东西丢进去都会消失,linux黑洞. /dev/zero 用于初始化,会产生0 今天先介绍 dd 命令 由来(全称):本来应根据其功能描述"C

一天一个shell命令 linux文本操作系列-diff命令详解_linux shell

这又是一个文件比较命令,熟练掌握会节省你很多工作.还记得comm命令吗?diff比他更加复杂,好用,不仅能比较文件,还能比较目录. 当一个文件有多个版本时候,或者更多复杂的文件,目录比较时,你会期望有一个比comm更有用的命令,diff正是为此而生. 全称:different file 实例: 文件1: v1.txt 复制代码 代码如下: hello   world v1_echo   v1_diff   v1_comm  shell is easy! 文件2: v2.txt 复制代码 代码如下

一天一个shell命令 linux文本操作系列-tree命令详解_linux shell

tree命令是以图形化的树结构打印文件和目录的主角.通常linux发行版本中并没有包括这个命令.你需要用包管理器自行安装. 实例: 1. tree 打印当前目录下所有文件 2. tree –p ${dir} 打印dir目录下所有文件,以及他们的权限 3. tree –h ${dir} 打印dir目录下所有文件,以及适读的大小 4. tree path –P "*.sh" 打印所有.sh结尾的文件 5. tree path –H http://localhost –o out.html

Shell实现文本去重并操持原有顺序_linux shell

简单来说,这个技巧对应的是如下一种场景 假设有文本如下 复制代码 代码如下: cccc aaaa bbbb dddd bbbb cccc aaaa 现在需要对它进行去重处理,这个很简单,sort -u就可以搞定,但是如果我希望保持文本原有的顺序,比如这里有两个aaaa,我只是希望去掉第二个aaaa,而第一个aaaa在bbbb的前面,去重后仍旧要在它前面,所以我期望的输出结果是 复制代码 代码如下: cccc aaaa bbbb dddd 当然,这个问题本身并不难,用C++或python写起来都很

JavaScript创建一个object对象并操作对象属性的用法

 这篇文章主要介绍了JavaScript创建一个object对象并操作对象属性的用法,实例分析了javascript使用object类定义对象及属性的用法,需要的朋友可以参考下     本文实例讲述了JavaScript创建一个object对象并操作对象属性的用法.分享给大家供大家参考.具体分析如下: 下面的JS代码创建了一个myMovie对象,并给对象title和director属性赋值,通过Object定义对象,其属性可以不用定义,直接调用即可,非常简单. ? 1 2 3 4 5 6 <sc

JavaScript创建一个object对象并操作对象属性的用法_javascript技巧

本文实例讲述了JavaScript创建一个object对象并操作对象属性的用法.分享给大家供大家参考.具体分析如下: 下面的JS代码创建了一个myMovie对象,并给对象title和director属性赋值,通过Object定义对象,其属性可以不用定义,直接调用即可,非常简单. <script type="text/javascript"> var myMovie = new Object(); myMovie.title = "Aliens"; myM

一天一个shell命令 linux文本内容操作系列-grep命令详解_linux shell

从这篇开始,是文本内容操作,区别于文本操作. Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户. shell,perl,python,一直都是文本操作的专家语言,而我们今后学习的的将是shell的噱头--文本操作.下面提到最常见的一个: grep 这算是文本内容的一个重量级选手,能根据某些规格在上千行的文本文件中查找

一天一个shell命令 linux文本内容操作系列-awk命令详解_linux shell

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. awk有3个不同版本: awk.nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本. awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK