设为首页 收藏本站
查看: 1116|回复: 0

shell中字符串的截取方法、cut基本用法

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2016-6-21 09:01:51 | 显示全部楼层 |阅读模式
一、八种基本字符截取方法:
     1、使用 # 号操作符。从左边删除第一次出现 substr 左边字符(包括substr ),保留右边字符。
          用法为 #*substr
例如:
wKioL1dnvzPwR73HAAAuVPd7rc8494.png
即删除从左边开始到第一个"//"及其左边所有字符
     2、使用 ## 号操作符。从左边删除最后一次出现substr 左边字符(包括substr ),保留右边字符。
          用法为 ##*subst
例如:
wKiom1dnv0PBRzVhAAAjvJUIshA274.png
即删除最后出现的"/"及其左边所有字符
     3、使用 % 号操作符。从右边删除第一次出现 substr 右边字符(包括substr ),保留左边字符。
          用法为 %substr
例如:
wKioL1dnv1LAhbLsAAAp5pzxe34857.png
即删除从右边开始到第一个"/"及其右边所有字符
     4、使用 %% 号操作符。从右边删除最后一次出现 substr 右边字符(包括substr ),保留左边字符。
          用法为 %%substr*
例如:
wKioL1dnv2KC_6jGAAAkXBGl9k8966.png
即删除从右边开始到最后一个"/"及其右边所有字符
    5、从左边第几个字符开始以及字符的个数
          用法为 :start:len
例如:
wKioL1dnv3GiVRT6AAAkPrzXNGY259.png
即 0 表示左边第一个字符开始,5 表示字符的总个数。
     6、从左边第几个字符开始一直到结束
          用法为 :start
例如:
wKiom1dnv4OhnAAjAAApEcqcFIE916.png
即 7 表示左边第8个字符开始
     7、从右边第几个字符开始以及字符的个数
          用法为 :0-start:len
例如:
wKioL1dnv5eCSWJnAAAj0HuQoSA987.png
即 0-10 表示右边算起第10个字符开始,6 表示字符的个数。
     8、从右边第几个字符开始一直到结束
     用法为 :0-start
例如:
wKioL1dnv6Sh7KEJAAAi8Grhqh4329.png
即 0-4 表示右边算起第4个字符开始。


二、使用 cut 进行字符串截取
     cut 命令接受三个定位方法:
1、字节(bytes),用选项-b;
2、字符(characters),用选项-c;
3、域(fields),用选项-f。


三、字节 -b 的使用
     (1) 以“字节”定位
例如:
如果我们想提取每一行的第3个字节,就这样:
wKiom1dnuM-iTs9MAAAqyj-zJ60143.png
     注:-b后面可以设定要提取哪一个字节,其实-b和3之间没有空格也是可以的,但推荐有空格 :)


     (2) 如果“字节”定位中,我想提取第3,第4、第5和第12个字节
-b支持形如3-5的写法,而且多个定位之间用逗号隔开就成了。
例如:
wKioL1dnuQaAg_JvAAAtyJNiETU403.png
但有一点要 注意,cut命令如果使用了-b选项,那么执行此命令时,cut会先把-b后面所有的定位进行从小到大排序,然后再提取。可不能颠倒定位的顺序哦。
例如:


     (3)类似于“3-5”这样的小技巧
例如:

     注:-3表示从第一个字节到第三个字节,而3-表示从第三个字节到行尾。可以看到这两种情况下,都包括了第三个字节“e”。如果执行who|cut -b -3,3-,是输出整行,而不会出现连续两个重叠的e的。


四、字符 -c 的使用
例如:

     但是,-c 和 -b 怎么没有区别呢? 其实不然,只是因为这个例子举的不好,所以看不出来,who 输出的都是单字节字符,所以用-b和-c没有区别,如果提取中文,区别就出来了。
例如:

      如上,用 -c 则会以字符为单位,输出正常;而 -b 只会以字节(8位二进制位)来计算,输出就是乱码。当遇到多字节字符时,可以使用 -n 选项,-n 用于告诉 cut 不要将多字节字符拆开。
例如:



五、域 -f 是怎么回事呢?
     (1)为什么会有“域”的提取呢,因为刚才提到的 -b 和 -c 只能在固定格式的文档中提取信息,而对于非固定格式的信息则束手无策,而“域”可以。
     比如/etc/passwd文件,它并不像 who 的输出信息那样具有固定格式,而是比较零散的排放。但是,冒号在这个文件的每一行中都起到了非常重要的作用,冒号用来隔开每一个项。
     cut命令提供了这样的提取方式,具体的说就是设置“间隔符”,再设置“提取第几个域”,就OK了。
例如(/etc/passwd的前五行内容):
wKiom1dnudbBe4AoAAB9hg92dp8023.png
     用 -d 设置间隔符为冒号:,然后用 -f 设置要取的是第一个域。
      (2)在设定 -f 时,也可以使用 3-5 或者 4- 类似的格式:
wKioL1dnudaSa_ISAABQcSFIGwg400.png

     (3)如果遇到空格和制表符时,怎么办?
     有时候制表符确实很难辨认,有一个方法可以看出一段空格到底是由若干个空格组成的还是由一个制表符组成的。

     如果是制表符(TAB),那么会显示为          符号,如果是空格,就会原样显示。通过此方法就可以判断制表符和空格了。
     应该在cut -d中用什么符号来设定制表符或空格呢?其实,cut 的 -d 选项的默认间隔符就是制表符        ,所以当你就是要使用制表符的时候,完全就可以省略-d选项,而直接用-f来取域就可以了。
例如:


wKioL1dnug_gXZ08AACH4vE3p0Y963.png
wKioL1dnuffgO9KlAAA_Py_-BdM198.png
wKiom1dnuafTB9faAAB5_CWdMeY085.png
wKioL1dnuYyBe1PfAABpEqrwsQk314.png
wKiom1dnuWfz2qQrAABRL7ehZkQ820.png
wKiom1dnuT6DKS46AABUDGtVFJ8233.png
wKiom1dnuSHy6jr6AABx7OsXPCA646.png
wKiom1dnuObhiqOQAABETCm-7Wo362.png

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-233066-1-1.html 上篇帖子: powershell Ftp 脚本 下篇帖子: shell脚本应用小程序 字符串
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表