设为首页 收藏本站
查看: 361|回复: 0

[经验分享] Linux当中正则表达式的书写以及grep命令的用法

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-4-15 11:00:08 | 显示全部楼层 |阅读模式
     正则表达式最早出现于unix系统当中,它主要用途是文本的检索。现在很多的文本编辑器,大部分主流操作系统,大部分的编程语言都支持正则表达式的使用,它的身影可谓无处不在。因此正则表达式的应用是计算机科学学习当中必须掌握的基本技能之一。
     正则表达式是由特定字符按照某种规则进行组合,并以此实现(文本)逻辑过滤。那么,对这个“规则”的思考与理解就是学习正则表达式的核心。
     grep: (Global search REgular expression and Print out the line)是linux下的文本搜索工具,它根据用户指定的文本模式(正则表达元字符以及正常字符组合而成)对目标文件进行逐行搜索,并显示能匹配到的行。

                grep命令形式及常用选项如下:
                         grep [OPTIONS] PATTERN  [FILE...]

                                 --color[=WHEN], --colour[=WHEN]
                                         auto
                                         always
                                         never
                    -o:  只显示被模式匹配到的内容
                                 -i:   ignore case,不区分字符大小写
                                 -v:  显示不能够被模式匹配到的行
                                 -E: 使用扩展的正则表达式
    正则表达式:是由元字符及一般字符所书写的模式,其中的元字符不表示字符本身的意义,而是用于表达控制或通配等功能。
    基本正则表达式元字符:
                        字符匹配:
                                     .  :匹配任意单个字符
                                    []: 匹配指定范围内的任意单个字符
                                    [^]: 匹配指定范围外的任意单个字符
                                        [0-9], [[:digit:]] 数字
                                        [a-z], [[:lower:]] 小写字母
                                        [A-Z], [[:upper:]] 大写字母
                                        [[:space:]] 空白字符
                                        [[:punct:]]
                                        [0-9a-zA-Z], [[:alnum:]] 所有数字和字母
                                        [a-zA-Z], [[:alpha:]] 字母
                次数匹配:在期望匹配字符后面提供一个控制符,用于表达匹配其前面字符指定的次                                  数
                                *  : 任意长度,表示0次、1次或多次;
           例如:a* 表示由任意数目个字母a组成的字符串,包括0个
                                .*: 任意长度的任意字符

                                \?:0次或1次;表示其左侧字符可有可无
                                       
                                \+: 1次或多次;表示其左侧字符至少出现1次;
                                \{m\}:m次;表示其左侧字符精确出现m次;
                                \{m,n\}:至少m次,至多n次;
                                \{0,n\}:至多n次;
                                \{m,\}:至少m次;
                        位置锚定:
                                  ^: 锚定行首
                                        ^PATTERN
                                  $: 锚定行尾
                                         PATTERN$
     单词锚定:由非特殊字符组成的连续的字符串

                                   \< :锚定词首,也可用\b
                                            \<PATTERN, 或\bPATTERN
                                    \> :锚定词尾,也可以用\b
                                             PATTERN\>, 或PATTERN\b

                                \<PATTERN\>:匹配PATTERN能匹配到的整个单词
                            
分组:\(\)
                分组中的模式,在某次的具体匹配过程中所匹配到的字符,可以被grep记忆(保存于   内置的变量中,这些变量是\1, \2, ...),因此,还可以被引用;
                \1: 引用,模式中自左而右,由第一个左括号以及与之对应的右括号中的模式所匹配到的内容;
                \2: 引用 ,模式中自左右,由第二个左括号以及与之对应的右括号中的模式所匹配到的内容;
例如:
      1:显示etc目录下的passwd文件中包含至少四个连续数字的行;
         grep “[0-9]\{4\}” /etc/passwd
          2:显示etc目录下passwd文件中以非bash结尾的行;
         Grep –v “bash$” /etc/passwd
      3: 显示etc目录下sos.conf文件中以#开头且包含至少一个空白字符并且以字母结尾的行;
          Grep –I “^#.*[:space:]\+.*[a-z]$” /etc/sos.conf
扩展的正则表达式:
                字符匹配:
                        .
                        []
                        [^]
                次数匹配:
                        *: 任意次
                        ?:0或1次
                        +: 至少1次
                        {m}:精确匹配m次;
                        {m,n}:至少m次,至多次;
                        {m,}:至少m次;
                        {0,n}:至多次;
                位置锚定:
                        ^
                        $
                        \<, \b
                        \>, \b
                分组:
                        ()

                        引用:\1, \2, ...
                或者:
                        a|b:a或者b
                                或者两侧的所有内容;

                命令:
                        grep -E PATTERN FILE...
                        egrep PATTERN FILE...
     正则表达式与扩展正则表达式的区别仅仅是部分去除了转义字符 “\”,
其格式基本一样。
    正则表达式关键在于灵活,以及结合管道命令之类的综合运用。做到这两点,才是真正的掌握好正则表达式,这一切的基础便是多加练习。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-57440-1-1.html 上篇帖子: centos安装crontab 下篇帖子: Linux磁盘和文件系统 表达式 Linux
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表