设为首页 收藏本站
查看: 409|回复: 0

[经验分享] Linux的文本处理工具grep及初识正则表达式

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-5-20 10:01:23 | 显示全部楼层 |阅读模式
一)、Linux的三大文本处理之GREP:
       GREP(Global search REgular expression and Print out the line,全面搜索正则表达式并把行打印出来):在给出文件列表或标准输出后,grep会对匹配一个或多个正则表达式的文本进行搜索,并只输出匹配(或者不匹配)的行或文本。----摘自于维基百科
       GREP家族包括:
       grep:
       egrep:支持扩展正则表达式的grep,等同于grep -E。
       fgrep:fixed grep或fast grep,不支持正则表达式。


二)、语法格式:
       grep [option]... 'PATTERN' FILE...
       注意:以字符串逐行查找。
       常用命令选项:
       -v:反向选取,即显示不匹配的行。
       -o:仅显示匹配的字串,而非字串所在的行。
       -i:ignore-case,忽略字符大小写。
       -E:支持使用扩展正则表达式。
       -A #:显示匹配行及下#行。
       -B #:显示匹配行及上#行。
       -C #:显示匹配行及上下#行。
       --color=auto:匹配到的字符串显示颜色。



三)、正则表达式:
       Regular Expression,在代码中常简写为regex、regexp或RE,计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。----摘自于维基百科


四)、元字符:

       1)、字符匹配:
              .:匹配任意一个单个字符
              []:匹配一个指定范围内的字符
              [^]:匹配一个不在指定范围内的字符
              [:digit:]:数字字符,即[0-9]
              [:lower:]:小写字符,即[a-z]
              [:upper:]:大写字符,即[A-Z]
              [:alpha:]:文字字符,即[A-Z,a-z]

              [:alnum:]:文字数字字符,即[A-Z,a-z,0-9]
              [:xdigit:]:十六进制数字,即[0-9,a-f,A-F]
              [:punct:]:标点符号
              [:space:]:空白字符
              [:graph:]:非空白字符
              [:cntrl:]:控制字符
              [:print:]:非空字符(包括空格)

       2)、次数匹配:
              *:零次或多次先前字符。
              .*:任意次任意字符
              \?:零次或一次先前字符。
              \{m\}:先前字符重复m次。
              \{m,n\}:先前字符m到n次。
              x\{m,\}:先前字符至少m次。
              x\{0,n\}:先前字符至多n次。

       3)、位置锚定:

              ^:行首锚定。

              $:行尾锚定。
              ^$:空白行。
              \<,/b:锚定词首,出现于单词左侧。
              \>,\b:锚定词尾,出现于单词右侧。
              \<..\>,\b..\b:单词锁定符。

       4)、分组和引用:
              \(..\):
                     分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用。
              \#:
                     引用第n个括号所匹配到的内容,而非模式本身。

五)、扩展正则表达式
       1)、字符匹配:
              与基本正则表达式相同。
       2)、次数匹配
              与基本正则表达式相同,且无需转译。
              +:一次或多次先前字符。
              a|b:分支,a或b,
                     con(C|c)at:concat或conCat
                     conC|cat:conC或cat
       3)、位置锚定:
              与基本正则表达式相同。
       4)、分组和引用
              与基本正则表达式相同,分组无需转译。




六)、实例说明:
01、显示/proc/meminfo文件中以大写或小写S开头的行。
1
2
#grep --color=auto -i '^s' /proc/meminfo
#grep --color=auto -E '^(s|S)' /proc/meminfo



wKioL1VaIS6wl2oBAACkJsrR-YA080.jpg

02、显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户。
1
#grep --color=auto -v "/sbin/nologin$" /etc/passwd | cut -d: -f1



wKiom1VaH8DgZ6WFAACEa2GwJXs040.jpg

03、显示/etc/passwd文件中其默认shell为/bin/bash的用户;
       进一步:仅显示上述结果中其ID号最大的用户。
1
#grep --color=auto "/bin/bash$" /etc/passwd | sort -t: -k3 -n | tail -n 1 | cut -d: -f1,3,7



wKiom1VaH87zvByiAABX6F_5fcU970.jpg

04、找出/etc/passwd文件中的一位数或两位数。
1
#grep --color=auto "\<[[:digit:]]\{1,2\}\>" /etc/passwd



wKiom1VaH_SAur4EAAKhKTsQrTw728.jpg

05、显示/boot/grub/grub.conf中以至少一个空白字符开头的行。

1
#grep --color=auto "^[[:space:]]\{1,}" /boot/grub/grub.conf



wKioL1VaIXzAkX27AAElBYOd6Tg786.jpg

06、显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行。
1
#grep --color=auto "^#[[:space:]]\{1,\}[^[:space:]]\{1,\}" /etc/rc.d/rc.sysinit



wKiom1VaIBGTNXIbAASQtcoFdI0282.jpg

07、找出netstat -tan命令执行结果中以'LISTEN'结尾的行。
1
#netstat -tan | grep --color=auto "LISTEN[[:space:]]*$"



wKiom1VaIBuDj9fjAADPi-vgbHc449.jpg

08、添加用户bash、testbash、basher、nologin(SHELL为/sbin/nologin),而找出当前系统上其用户名和默认shell相同的用户。
1
#grep --color=auto "^\([[:alpha:]]\{1,\}\):.*/\1$" /etc/passwd



wKioL1VaIZ6AGznBAADlRRlcy_8654.jpg

09、显示当前系统上root、rhel或centos用户的默认shell。
1
#grep --color=auto -E "^(root|rhel|centos):.*" /etc/passwd | cut -d: -f1,7



wKioL1VaIbjyaAYMAAB-ygYdW7g081.jpg

10、找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号"()"行
1
#grep --color=auto -E "\<[[:alpha:]]+\>\(\)" /etc/rc.d/init.d/functions



wKiom1VaIEmCEbL4AADVTW_Jxp0155.jpg

11、找出ifconfig命令结果中的1-255之间的数字;
1
#ifconfig | grep --color=auto -E "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>"



wKiom1VaIFOSpn54AAGiK_c0s-M957.jpg


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-68791-1-1.html 上篇帖子: ubuntu中将java环境由安装版的openjdk替换为Oracle的jdk 下篇帖子: linux(centos)下安装和开启curl php扩展 表达式 Linux
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表