设为首页 收藏本站
查看: 697|回复: 0

[经验分享] grep与正则表达式

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2018-4-9 09:52:00 | 显示全部楼层 |阅读模式
Grep介绍:

  grep (缩写来自Globally search a Regular Expression and Print)是一种强大的文本搜索工具,它能使用特定模式匹配(包括正则表达式)搜索文本,并默认输出匹配行。Unix的grep家族包括grep、egrep和fgrep。Windows系统下类似命令FINDSTR。
grep    egrep    fgrep(不支持正则表达式)
grep需要标准输入 因此常常位于管道右侧
命令参数:

--color=auto: 对匹配到的文本着色显示
-v: 显示不被pattern匹配到的行
-i: 忽略字符大小写
-n:显示匹配的行号  
-c: 统计匹配的行数  
-o: 仅显示匹配到的字符串  
-q: 静默模式,不输出任何信息  
-A #: after, 后#行
-B #: before, 前#行  
-C #:context, 前后各#行  
-e:实现多个选项间的逻辑or关系  
grep –e ‘cat ’  -e ‘dog’  file  
-w:匹配整个单词  数字加字母下划线全都算单词的一部分,其他的都是单词的分隔符
-E:相当于egrep  
-F:相当于fgrep,不支持正则表达式
-f: 跟一个文件(写有不同字符)进行内容检索是逻辑or关系
  练习题:
  
  1、显示三个用户root、centos、arch的UID和默认shell (用户需要自己创建)
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  2、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一 个小括号的行
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  3、使用egrep取出/etc/rc.d/init.d/functions中其基名
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  4、使用egrep取出上面路径的目录名
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  5、统计last命令中以root登录的每个主机IP地址登录次数
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  6、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255
     0-9: [0-9]    10-99: [1-9][0-9]    100-199: 1[0-9][0-9]    200-249: 2[0-5][0-9]    250-255: 25[0-5]  7、显示ifconfig命令结果中所有IPv4地址
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
  8、将此字符串:welcome to centos linux 中的每个字符排序,重复 次数多的排到前面
watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=
正则表达式:
  REGEXP:由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符) 不表示字符字面意义,而表示控制或通配的功能
  程序支持:grep,sed,awk,vim, less,nginx,varnish等
  分两类:  
     基本正则表达式:BRE  
     扩展正则表达式:ERE   
         grep -E, egrep
正则表达式引擎:  
     采用不同算法,检查处理正则表达式的软件模块        
     PCRE(Perl Compatible Regular Expressions)
元字符分类:字符匹配、匹配次数、位置锚定、分组
man  7 regex

字符匹配:
     .    匹配任意单个字符  默认是贪婪匹配
     []   匹配指定范围内的任意单个字符  .在里面也是点不需要转义
     [^]  匹配指定范围外的任意单个字符  
     [:alnum:] 字母和数字   
     [:alpha:] 代表任何英文大小写字符,亦即 A-Z, a-z  
     [:lower:] 小写字母   
     [:upper:] 大写字母  
     [:blank:] 空白字符(空格和制表符)  
     [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)  
     [:cntrl:] 不可打印的控制字符(退格、删除、警铃...)  
     [:digit:] 十进制数字
     [:xdigit:]十六进制数字  
     [:graph:] 可打印的非空白字符  
     [:print:] 可打印字符  
     [:punct:] 标点符号

匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数  
     * 匹配前面的字符任意次,包括0次
         贪婪模式:尽可能的匹配符合条件的字符  
     .* 任意长度的任意字符  
     \? 匹配其前面的字符0或1次  
     \+ 匹配其前面的字符至少1次  
     \{n\} 匹配前面的字符n次  
     \{m,n\} 匹配前面的字符至少m次,至多n次  
     \{,n\} 匹配前面的字符至多n次  
     \{n,\} 匹配前面的字符至少n

位置锚定:定位出现的位置  
     ^ 行首锚定,用于模式的最左侧  
     $ 行尾锚定,用于模式的最右侧  
     ^PATTERN$  用于模式匹配整行   
     ^$  空行   
     ^[[:space:]]*$  空白行  
     \< 或 \b 词首锚定,用于单词模式的左侧  
     \> 或 \b 词尾锚定;用于单词模式的右侧  
     \<PATTERN\> 匹配整个单词

分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如: \(root\)\+
     分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,
     这些变量的命名方式为: \1, \2, \3, ...
     \1  表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
         示例:  \(string1\+\(string2\)*\)        
         \1 :string1\+\(string2\)*        
         \2 :string2

     后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
     或者:\|  
         示例:a\|b: a或b  C\|cat: C或cat   \(C\|c\)at:Cat或cat

扩展的正则表达式:
     egrep = grep -E
     egrep [OPTIONS] PATTERN [FILE...]
     扩展正则表达式的元字符:

     字符匹配:  
         . 任意单个字符  
         [] 指定范围的字符  
         [^] 不在指定范围的字符

    次数匹配:  
         *:匹配前面字符任意次  
         ?: 0或1次      
         +:1次或多次  
         {m}:匹配m次  
         {m,n}:至少m,至多n次

    位置锚定:  
         ^  :行首  
         $  :行尾  
         \<, \b :语首  
         \>, \b :语尾

  分组:     
             ()    后向引用:\1, \2, ...
             或者:  
             a|b: a或b  C|cat: C或cat  (C|c)at:Cat或cat

练习题:

           1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)

2、显示/etc/passwd文件中不以/bin/bash结尾的行

3、显示用户rpc默认的shell程序

           4、找出/etc/passwd中的两位或三位数 (只要数字的话可以加-o选项仅仅显示数字)               
           5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白字符开头的且后面有非 空白字符的行
           6、找出“netstat -tan”命令结果中以LISTEN后跟任意多个空白字符结尾的行              
           7、显示CentOS7上所有系统用户的用户名和UID                
           8、添加用户bash、testbash、basher、sh、nologin(其shell为/sbin/nologin),找 出/etc/passwd用户名和shell同名的行
           9、利用df和grep,取出磁盘各分区利用率,并从大到小排序  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-448357-1-1.html 上篇帖子: linux下制作ISO文件 下篇帖子: Red Hat Enterprise 6.5的安装
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表