awk 系列:如何使用 awk 的特殊模式 BEGIN 和 END

在 awk 系列的第八节,我们介绍了一些强大的 awk 命令功能,它们是变量、数字表达式和赋值运算符。

本节我们将学习更多的 awk 功能,即 awk 的特殊模式:BEGIN 和 END

学习 awk 的模式 BEGIN 和 END

随着我们逐渐展开,并探索出更多构建复杂 awk 操作的方法,将会证明 awk 的这些特殊功能的是多么强大。

开始前,先让我们回顾一下 awk 系列的介绍,记得当我们开始这个系列时,我就指出 awk 指令的通用语法是这样的:


  1. # awk 'script' filenames

在上述语法中,awk 脚本拥有这样的形式:


  1. /pattern/ { actions }

你通常会发现脚本中的模式(/pattern/)是一个正则表达式,此外,你也可以在这里用特殊模式 BEGIN 和END。因此,我们也能按照下面的形式编写一条 awk 命令:


  1. awk '
  2. BEGIN { actions }
  3. /pattern/ { actions }
  4. /pattern/ { actions }
  5. ……….
  6. END { actions }
  7. ' filenames

假如你在 awk 脚本中使用了特殊模式:BEGIN 和 END,以下则是它们对应的含义:

  • BEGIN 模式:是指 awk 将在读取任何输入行之前立即执行 BEGIN 中指定的动作。
  • END 模式:是指 awk 将在它正式退出前执行 END 中指定的动作。

含有这些特殊模式的 awk 命令脚本的执行流程如下:

  1. 当在脚本中使用了 BEGIN 模式,则 BEGIN 中所有的动作都会在读取任何输入行之前执行。
  2. 然后,读入一个输入行并解析成不同的段。
  3. 接下来,每一条指定的非特殊模式都会和输入行进行比较匹配,当匹配成功后,就会执行模式对应的动作。对所有你指定的模式重复此执行该步骤。
  4. 再接下来,对于所有输入行重复执行步骤 2 和 步骤 3。
  5. 当读取并处理完所有输入行后,假如你指定了 END 模式,那么将会执行相应的动作。

当你使用特殊模式时,想要在 awk 操作中获得最好的结果,你应当记住上面的执行顺序。

为了便于理解,让我们使用第八节的例子进行演示,那个例子是关于 Tecmint 拥有的域名列表,并保存在一个叫做 domains.txt 的文件中。


  1. news.tecmint.com
  2. tecmint.com
  3. linuxsay.com
  4. windows.tecmint.com
  5. tecmint.com
  6. news.tecmint.com
  7. tecmint.com
  8. linuxsay.com
  9. tecmint.com
  10. news.tecmint.com
  11. tecmint.com
  12. linuxsay.com
  13. windows.tecmint.com
  14. tecmint.com

  1. $ cat ~/domains.txt

查看文件内容

在这个例子中,我们希望统计出 domains.txt 文件中域名 tecmint.com 出现的次数。所以,我们编写了一个简单的 shell 脚本帮助我们完成任务,它使用了变量、数学表达式和赋值运算符的思想,脚本内容如下:


  1. #!/bin/bash
  2. for file in $@; do
  3. if [ -f $file ] ; then
  4. ### 输出文件名
  5. echo "File is: $file"
  6. ### 输出一个递增的数字记录包含 tecmint.com 的行数
  7. awk '/^tecmint.com/ { counter+=1 ; printf "%s\n", counter ; }' $file
  8. else
  9. ### 若输入不是文件,则输出错误信息
  10. echo "$file 不是一个文件,请指定一个文件。" >&2 && exit 1
  11. fi
  12. done
  13. ### 成功执行后使用退出代码 0 终止脚本
  14. exit 0

现在让我们像下面这样在上述脚本的 awk 命令中应用这两个特殊模式:BEGIN 和 END

我们应当把脚本:


  1. awk '/^tecmint.com/ { counter+=1 ; printf "%s\n", counter ; }' $file

改成:


  1. awk ' BEGIN { print "文件中出现 tecmint.com 的次数是:" ; }
  2. /^tecmint.com/ { counter+=1 ; }
  3. END { printf "%s\n", counter ; }
  4. ' $file

在修改了 awk 命令之后,现在完整的 shell 脚本就像下面这样:


  1. #!/bin/bash
  2. for file in $@; do
  3. if [ -f $file ] ; then
  4. ### 输出文件名
  5. echo "File is: $file"
  6. ### 输出文件中 tecmint.com 出现的总次数
  7. awk ' BEGIN { print "文件中出现 tecmint.com 的次数是:" ; }
  8. /^tecmint.com/ { counter+=1 ; }
  9. END { printf "%s\n", counter ; }
  10. ' $file
  11. else
  12. ### 若输入不是文件,则输出错误信息
  13. echo "$file 不是一个文件,请指定一个文件。" >&2 && exit 1
  14. fi
  15. done
  16. ### 成功执行后使用退出代码 0 终止脚本
  17. exit 0

awk 模式 BEGIN 和 END

当我们运行上面的脚本时,它会首先输出 domains.txt 文件的位置,然后执行 awk 命令脚本,该命令脚本中的特殊模式 BEGIN 将会在从文件读取任何行之前帮助我们输出这样的消息“文件中出现 tecmint.com 的次数是:”。

接下来,我们的模式 /^tecmint.com/ 会在每个输入行中进行比较,对应的动作 { counter+=1 ; } 会在每个匹配成功的行上执行,它会统计出 tecmint.com 在文件中出现的次数。

最终,END 模式将会输出域名 tecmint.com 在文件中出现的总次数。


  1. $ ./script.sh ~/domains.txt

用于统计字符串出现次数的脚本

原文发布时间为:2016-08-06

本文来自合作伙伴“Linux中国”

时间: 2024-09-17 20:26:40

awk 系列:如何使用 awk 的特殊模式 BEGIN 和 END的相关文章

awk系列:在awk中如何使用流程控制语句

当你回顾所有到目前为止我们已经覆盖的 awk 实例,从 awk 系列的开始,你会注意到各种实例的所有指令是顺序执行的,即一个接一个地执行.但在某些情况下,我们可能希望基于一些条件进行文本过滤操作,即流程控制语句允许的那些语句. 在 awk 编程中有各种各样的流程控制语句,其中包括: if-else 语句 for 语句 while 语句 do-while 语句 break 语句 continue 语句 next 语句 nextfile 语句 exit 语句 然而,对于本系列的这一部分,我们将阐述:

awk 系列:在 awk 中如何使用流程控制语句

当你回顾所有到目前为止我们已经覆盖的 awk 实例,从 awk 系列的开始,你会注意到各种实例的所有指令是顺序执行的,即一个接一个地执行.但在某些情况下,我们可能希望基于一些条件进行文本过滤操作,即流程控制语句允许的那些语句. 在 awk 编程中有各种各样的流程控制语句,其中包括: if-else 语句 for 语句 while 语句 do-while 语句 break 语句 continue 语句 next 语句 nextfile 语句 exit 语句 然而,对于本系列的这一部分,我们将阐述:

awk系列:如何使用awk的特殊模式 BEGIN 和 END

在 awk 系列的第八节,我们介绍了一些强大的 awk 命令功能,它们是变量.数字表达式和赋值运算符. 本节我们将学习更多的 awk 功能,即 awk 的特殊模式:BEGIN 和 END. 随着我们逐渐展开,并探索出更多构建复杂 awk 操作的方法,将会证明 awk 的这些特殊功能的是多么强大. 开始前,先让我们回顾一下 awk 系列的介绍,记得当我们开始这个系列时,我就指出 awk 指令的通用语法是这样的: # awk 'script' filenames  在上述语法中,awk 脚本拥有这样

awk 系列:如何使用 awk 按模式筛选文本或字符串

作为 awk 命令系列的第三部分,这次我们将看一看如何基于用户定义的特定模式来筛选文本或字符串. 在筛选文本时,有时你可能想根据某个给定的条件或使用一个可被匹配的特定模式,去标记某个文件或数行字符串中的某几行.使用 awk 来完成这个任务是非常容易的,这也正是 awk 中可能对你有所帮助的几个功能之一. 让我们看一看下面这个例子,比方说你有一个写有你想要购买的食物的购物清单,其名称为 food_prices.list,它所含有的食物名称及相应的价格如下所示: $ cat food_prices.

awk系列:如何让awk使用 Shell 变量

当我们编写 shell 脚本时,我们通常会在脚本中包含其它小程序或命令,例如 awk 操作.对于 awk 而言,我们需要找一些将某些值从 shell 传递到 awk 操作中的方法. 我们可以通过在 awk 命令中使用 shell 变量达到目的,在 awk 系列的这一节中,我们将学习如何让 awk 使用 shell 变量,这些变量可能包含我们希望传递给 awk 命令的值. 有两种可能的方法可以让 awk 使用 shell 变量: 1. 使用 Shell 引用 让我们用一个示例来演示如何在一条 aw

awk 系列:如何让 awk 使用 Shell 变量

当我们编写 shell 脚本时,我们通常会在脚本中包含其它小程序或命令,例如 awk 操作.对于 awk 而言,我们需要找一些将某些值从 shell 传递到 awk 操作中的方法. 我们可以通过在 awk 命令中使用 shell 变量达到目的,在 awk 系列的这一节中,我们将学习如何让 awk 使用 shell 变量,这些变量可能包含我们希望传递给 awk 命令的值. 有两种可能的方法可以让 awk 使用 shell 变量: 1. 使用 Shell 引用 让我们用一个示例来演示如何在一条 aw

awk 系列:如何使用 awk 的 ‘next’ 命令

在 awk 系列的第六节,我们来看一下next命令 ,它告诉 awk 跳过你所提供的所有剩下的模式和表达式,直接处理下一个输入行. next 命令帮助你阻止运行命令执行过程中多余的步骤. 要明白它是如何工作的, 让我们来分析一下 food_list.txt 它看起来像这样: Food List Items No Item_Name Price Quantity 1 Mangoes $3.45 5 2 Apples $2.45 25 3 Pineapples $4.45 55 4 Tomatoes

awk系列:如何使用awk语言编写脚本

从 awk 系列开始直到第 12 部分,我们都是在命令行或者脚本文件里写一些简短的 awk 命令和程序. 然而 awk 和 shell 一样也是一个解释型语言.通过从开始到现在的一系列的学习,你现在能写可以执行的 awk 脚本了. 和写 shell 脚本差不多,awk 脚本以下面这一行开头: #! /path/to/awk/utility -f  例如在我的系统上,awk 工具安装在 /user/bin/awk 目录,所以我的 awk 脚本以如下内容作为开头: #! /usr/bin/awk -

awk 系列:如何使用 awk 比较操作符

对于 使用 awk 命令的用户来说,处理一行文本中的数字或者字符串时,使用比较运算符来过滤文本和字符串是十分方便的. 在 awk 系列的此部分中,我们将探讨一下如何使用比较运算符来过滤文本或者字符串.如果你是程序员,那么你应该已经熟悉了比较运算符:对于其它人,下面的部分将介绍比较运算符. awk 中的比较运算符是什么? awk 中的比较运算符用于比较字符串和或者数值,包括以下类型: > – 大于 < – 小于 >= – 大于等于 <= – 小于等于 == – 等于 != – 不等于