一天一个shell命令 linux文本内容操作系列-cut命令详解_linux shell

说明:

cut 按列切分文件,你可以指定分隔每列的定界符。在cut的术语中,每列都是一个字段,就是有时候说第一列,可能表述称第一个字段。

实战:

假设有文件data.txt,格式如下

NO    Name    Mark    Percent
 1    Sarath    45    90
 2    Alex    49    98
 3    Anu    45    90

分隔符(定界符)为Tab 制表符

如果我要取得第二列,所有人的名称,有什么好的办法吗?此时cut该大显身手了。

1. 取得2,3列 即name,和mark

$cut –f 2,3 data.txt

2. 取得除第3列以外所有列

$cut –f3 –complement data.txt

3. 采取其他定界符,可以用-d改变。

复制代码 代码如下:

 假设data_comma.txt:

NO,Name,Mark,Percent
 1,Sarath,45,90
 2,Alex,49,98
 3,Anu,45,90

则:
$cut –f2 -d"," data_comma.txt

解读—help

用法:cut [选项]... [文件]...
从每个文件中输出指定部分到标准输出。

长选项必须使用的参数对于短选项时也是必需使用的。
  -b, --bytes=列表            只选中指定的这些字节
  -c, --characters=列表       只选中指定的这些字符
  -d, --delimiter=分界符      使用指定分界符代替制表符作为区域分界
  -f, --fields=列表           只选中指定的这些域;并打印所有不包含分界符的
                行,除非-s 选项被指定
  -n                (忽略)
       --complement            补全选中的字节、字符或域
  -s, --only-delimited        不打印没有包含分界符的行
      --output-delimiter=字符串    使用指定的字符串作为输出分界符,默认采用输入
                的分界符
      --help                  显示此帮助信息并退出
      --version               显示版本信息并退出

仅使用f -b, -c 或-f 中的一个。每一个列表都是专门为一个类别作出的,或者您可以用逗号隔
开要同时显示的不同类别。您的输入顺序将作为读取顺序,每个仅能输入一次。
 每种参数格式表示范围如下:
    N    从第1 个开始数的第N 个字节、字符或域
    N-    从第N 个开始到所在行结束的所有字符、字节或域
    N-M    从第N 个开始到第M 个之间(包括第M 个)的所有字符、字节或域
    -M    从第1 个开始到第M 个之间(包括第M 个)的所有字符、字节或域

当没有文件参数,或者文件不存在时,从标准输入读取

解读:

1.取得某一列的字符或者字节 可以用-c, -b等

2.可以取得某个范围

1和2综合例子:

有文件range_data.txt,内容如下

复制代码 代码如下:

abcdefghijklmnopqrstuvwxyz
 abcdefghijklmnopqrstuvwxyz
 abcdefghijklmnopqrstuvwxyz
 abcdefghijklmnopqrstuvwxyz

运行:$cut range_data.txt -c-2

打印字符1-2列

再复杂一点:

$cut range_data.txt -c1-3,6-9 --output-delimiter ","

打印1-3行,6-9行,并且用逗号分隔。

命令比较简单,主要还是借鉴书籍《linux shell脚本攻略》,从附件中会看到一排格式很差的字母,尝试用-s过滤掉他。

时间: 2024-10-23 13:01:33

一天一个shell命令 linux文本内容操作系列-cut命令详解_linux shell的相关文章

一天一个shell命令 linux文本内容操作系列-grep命令详解_linux shell

从这篇开始,是文本内容操作,区别于文本操作. Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来.grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户. shell,perl,python,一直都是文本操作的专家语言,而我们今后学习的的将是shell的噱头--文本操作.下面提到最常见的一个: grep 这算是文本内容的一个重量级选手,能根据某些规格在上千行的文本文件中查找

一天一个shell命令 linux文本内容操作系列-awk命令详解_linux shell

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. awk有3个不同版本: awk.nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本. awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK

一天一个shell命令 linux文件内容操作系列-cat命令详解_linux shell

注:在awk命令之后,没有太多复杂命令,都是一些基础命令. 说明: cat,是单词 concatenate 的缩写, 把文件的内容输出到stdout.当与重定向操作符 (> 或 >>结合使用时, 一般都是用来将多个文件连接起来. 用法: 1. $cat file1 file2 file3 2. 不仅可以从文件中读取内容并且拼接,还能从标准输入流中读取 例如:$echo 'some content' |  cat - file.txt 解释:这里的 - 就代表了 'some content

一天一个shell命令 linux文本操作系列-tac,rev命令详解_linux shell

说明: tac和rev没有必然联系,唯一相同的是,他们是"反派".tac其实是cat的反写,cat正常输出,那tac就倒着输出,不过从行的最后一行输出,那rev呢?rev是每行的最后一个字母到第一个字母倒序输出. 简单实例 tac命令 文件过滤分割与合并 tac命令用于将文件已行为单位的反序输出,即第一行最后显示,最后一行先显示. 语法 tac(选项)(参数) 选项 -a或--append:将内容追加到文件的末尾: -i或--ignore-interrupts:忽略中断信号. 参数 文

一天一个shell命令 linux文件操作系列-ln命令详解_linux shell

里提示一下:ubuntu的翻译很多都是字面直译,存在很多问题,所以建议大家参照我这里的解释.当然本来也是有些赶文的嫌疑,望指正. 经常在linux上操作,有在不同的目录下切换某几个固定的命令,或者修改几个固定的文件,这时候,如果能在一个目录下就操作他们,会是一件多么轻松的事情.我们来看看链接命令ln 全称 ln 全称是link 顾名思义,这是一个建立一个链接.怎么去理解呢?它的功能类似于Mac OS的别名或者Windows的快捷方式, 删除不会影响文件本身. 说明:(直接看看斜体,就行了) 链接

linux awk时间计算脚本及awk命令详解_linux shell

在linux如果计划时间是个麻烦事, 用awk脚本如下 BEGIN {FS=":";OFS=":"} {total_seconds=total_seconds+$3} total_seconds>=60 {total_seconds=total_sconds-60 $2=$2+1 } {total_minutes=total_minutes+$2 $2=$2+1 } {total_minutes=total_minutes+$2} total_minutes&

shell(bash)下“time” 命令的输出详解_linux shell

前言 相信大家都知道bash下time是一个很有用的命令,它可以为一段脚本或一个程序的执行计时,这通常在粗略比较程序执行效率的时候很方便.但是你会发现,time命令输出的时间文字不能被简单地重定向,例如重定向至一个文本文件,只能显示在屏幕上,这对于非交互计时很不方便. 例如: $ time find . -name "mysql.sh" >1.txt real 0m0.081s user 0m0.060s sys 0m0.020s $ time find . -name &quo

Shell编程中while与for的区别及用法详解_linux shell

在shell编程中经常用到循环,常用的循环有for和while循环两种.while循环默认以行读取文件,而for循环以空格读取文件切分文件,本篇就结合现网的一些使用示例说说二者的用法和区别. 一.常用语法 1.for循环 for循环常用的语法结构有如下几种: for 变量 in seq字符串 for 变量 in `command` " " for 变量 in "$@"或"$*" for((赋值:条件:运算语句)) 2.while循环 while循

一天一个shell命令 linux文本操作系列-head,tail命令详解_linux shell

head命令中文介绍: 用法:head [选项]... [文件]... 将每个指定文件的头10 行显示到标准输出. 如果指定了多于一个文件,在每一段输出前会给出文件名作为文件头. 如果不指定文件,或者文件为"-",则从标准输入读取数据. 长选项必须使用的参数对于短选项时也是必需使用的. -c, --bytes=[-]K 显示每个文件的前K 字节内容: 如果附加"-"参数,则除了每个文件的最后K字节数据外 显示剩余全部内容 -n, --lines=[-]K 显示每个文