设为首页 收藏本站
查看: 710|回复: 0

[经验分享] linux的awk工具介绍

[复制链接]

尚未签到

发表于 2017-11-23 09:10:29 | 显示全部楼层 |阅读模式
一.AWK简介
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。
awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。
awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言: AWK 程序设计语言 , 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。
二.使用方法
awk '{pattern +action}' {filenames}
尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而action 是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。 pattern就是要表示的正则表达式,用斜杠括起来。
awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。
通常,awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。
三.调用awk的方式
有三种方式调用awk
1.命令行方式
1
awk [-F  field-separator]  'commands' input-file(s)



其中,commands 是真正awk命令,[-F域分隔符]是可选的。 input-file(s) 是待处理的文件。
在awk中,文件的每一行中,由域分隔符分开的每一项称为一个域。通常,在不指名-F域分隔符的情况下,默认的域分隔符是空格。
2.shell脚本方式
将所有的awk命令插入一个文件,并使awk程序可执行,然后awk命令解释器作为脚本的首行,一遍通过键入脚本名称来调用。
相当于shell脚本首行的:#!/bin/sh
可以换成:#!/bin/awk
3.将所有的awk命令插入一个单独文件,然后调用:
awk -fawk-script-file input-file(s)
其中,-f选项加载awk-script-file中的awk脚本,input-file(s)跟上面的是一样的。
四.awk基本命令介绍
选项:
-F[:]:指明输入字段分隔符
-v var=var :变量赋值,对内置变量或自定义变量赋值

实例1:以逗号为字段分隔符,打印文本内容的第一个字段和第三个字段(取到的结果就是用户的用户名和UID)
1
2
3
4
5
#gawk -F:  '{print $1,$3}' /etc/passwd
root 0
bin 1
daemon 2





无逗号就会连接两个字段,逗号是输出分隔符
1
2
3
4
5
# gawk -F:  '{print $1$3}' /etc/passwd
root0
bin1
daemon2





这种是awk+action的示例,每行都会执行action{print $1,$3}。
五.awk的输出命令:print和printf
awk中同时提供了print和printf两种打印输出的函数。
5.1.print命令:
命令用法:
1
printitem1,item2……



使用要点:
1.各item间使用逗号分割,而输出时则使用输出分隔符
2.输出的各item可以是字符串或数值,当前记录的字段($n),变量或awk的表达式;数值会被隐式转换为字符进行输出
3.print后面的item如果省略,相当于print $0(输出整行);输出空白使用print"";
5.2.printf命令:
命令格式:
1
printf  format,item1,item2……



使用要点:
1.format格式符必须使用
2.不会自动换行,需要手动添加行分隔符
3.format格式符中需要分别为后面的每个item指定一个格式符
格式符:都以%开头,后跟一个字符
        %c:显示字符的ASCII码;
        %i,%d:显示十进制整数;
        %e,%E:科学计数法显示数值;
        %f:显示浮点数;
        %g,%G:以科学计数法格式或浮点数格式显示数值;
        %s:字符串;
        %u:无符号整数;
        %%:显示%自身
141228130937113.jpg

修饰符:
        #[.#]:第一个#显示宽度,例如%30s;第二个.#显示小数点后精度
        -:左对齐
        +:显示数值符号
141228130937114.jpg

141228130937111.jpg

141228130937112.jpg

六.awk的变量
6.1.内置变量
records:行相关
fields:字段相关
FS: input field seperator,字段分隔符,默认为空白字符
#awk -v FS=":" '{print $1,$3}' /etc/passwd
1412281309371116.jpg

OFS:output fieldseparator,输出字段分隔符
语句与语句之间分隔符定义,默认是空格
# awk'BEGIN{FS=":"; OFS="="} {print $1,$3}' /etc/passwd
1412281309371112.jpg
RS:input record seperator,输入记录的分隔符,默认为新行。
实例:以冒号为换行符,输出全文内容
# awk -v RS=":" '{print $0}' /etc/passwd
141228130937118.jpg
ORS: Outpput Row Seperator, 输出时的行分隔符;
默认的行分隔符一般都是换行,我们可以自定义为#
下面就是将所有以:为分隔符的替换成以#的分隔符:
# awk 'BEGIN{ RS=":";ORS="#"} {print $0}' /etc/passwd
141228130937117.jpg
NF:Number of Field,当前记录的字段(field)个数
统计/etc/issue文件内每行字段的个数:
# awk '{print NF}' /etc/issue
1412281309371114.jpg
注意:这里NF是变量引用,可以不用加$,$NF显示字段位置

NR: number of inputrecords ,当前文本的行数
1412281309371111.jpg
如果有多个文件,这个数目会把处理的多个文件中行统一计数
141228130937115.jpg

FNR: 与NR不同的是,FNR用于记录正处理的行是当前这一文件中被总共处理的行数
141228130937119.jpg

ARGV:数组,保存命令本身这个字符,awk'{print $0}' file1 file2,意味着ARGV[0]保存awk,
1412281309371115.jpg

ARGC: 保存awk命令中参数的个数,不包含命令本身;
此命令中有3个参数,为awk  /etc/fstab  /etc/issue
1412281309371110.jpg

FILENAME:当前文件名
141228130937116.jpg
IGNORECASE:控制是否忽略字符大小写变量

6.2.自定义变量
直接使用
-v var=valname:变量名区分字符大小写
1.可以在program中定义变量
2.可以在选项中定义变量
例如:
1412281309371113.jpg
等同于:
# awk -v file="passwd" '{printfile,$1}' /etc/passwd


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-409762-1-1.html 上篇帖子: Linux运维常用命令笔记 下篇帖子: centos7 启动流程
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表