AWK 介绍:一个报文格式化,从文本文件中抽取数据包的工具。

思维: 基于模式动作形式,在动作前指定特定的模式,使动作在记录满足模式时才执行。

 

基本概念:

1、模式和动作:

模式:即触发动作的条件,模式部分决定动作何时触发及触发事件。

可以是:a 条件语句 if($4=="Green")

                 b 复合语句  and &&)、 or||)、! 

                 c 正则表达式   awk '$0 ~/[Gg]reen/  {print  $0}'  grade.txt

动作:对数据进行的操作。 动作必须用{}括起来

2、域和记录:

域:awk将标准输入的每一行按照分隔符分成n个域,依次为$1,$2,$3,…,$n

要输出域采用print语句,输出所有域使用$0.

 

 

判断AWK语句错误的一些依据:

1)、确保整个awk命令用单引号括起来;

2)、确保命令内的所有引号成对出现;

3)、确保用花括号括起动作语句,用圆括号括起条件语句;

 

重点知识点:

1AWK输出报头和报尾及格式化输出。

BEGIN  END  采用print语句格式输出

例如:

awk 'BEGIN {print "Name    Belt\n----------------------"} {print

 $1 "\t\t" $4} END {print "end-of-report"}' grade.txt

Name    Belt

----------------------

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

P.Bunny         02/99   48      Yellow  12      35      28

J.Troll         07/99   4842    Brow-3  12      26      26

L.Tansley       05/99   4712    Brow-3  12      30      28

end-of-report

tom@svr:~/ssh$    

BEGIN: 设置计数和打印头

END用来在a w k完成文本浏览动作后打印输出文本总数和结尾状态标志

 

2、使用正则表达式  ~

1)打印第4个域值为Greengreen的行

tom@svr:~/ssh$ awk '{if($4~/[Gg]reen/) print $0}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

tom@svr:~/ssh$  

2)打印第4个域值非Greengreen的行  !~

tom@svr:~/ssh$ awk '{if($4!~/[Gg]reen/) print $0}' grade.txt

P.Bunny         02/99   48      Yellow  12      35      28

J.Troll         07/99   4842    Brow-3  12      26      26

L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$

3)匹配行中出现有特定字符的行,省去了if条件

tom@svr:~/ssh$ awk '$0 ~/[Gg]reen/ {print $0}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

tom@svr:~/ssh$

 

3、条件表达式

完全匹配某字符串  ==

tom@svr:~/ssh$ awk '{if($4=="Green") print $0}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

tom@svr:~/ssh$

不可写成:

awk 'if($4=="Green") {print $0}' grade.txt

if条件是动作的一部分,必须与动作写在一个花括号内。

 

 

AWK内置变量:

NR:已读的记录数

NF:浏览记录的域个数

FILENAME: awk浏览的文件名 awk一次可以浏览多个文件

 

tom@svr:~/ssh$ awk '{if(NR>0 && $4~/(green|Green)/) print $0}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

tom@svr:~/ssh$