|
一、概述
cut是将文本文件按列分割的工具,并且可以指定列与列之间的定界符。每一列称为一个字段。
制表符\t 是默认的定界符,如何一行中没有定界符,将原样输出。
二、具体使用方法
(1)从文本文件中提取指定列, field_list是由列号组成作为-f的参数,列号从1开始,使用逗号隔开
cut -f field_list filename eg.
[1]提取文件file的第2列和第3列
cut -f 2,3 file [2]从标准输入中获得数据,进行分割
cat file | cut -f 2,3 [3]默认没有定界符的行将显示,使用-s选项去掉没有定界符的行
cut -f 3,4 file -s #没有制表符的行将不再显示
(2)指定排除某些列(需要提取的列很多,则进行补集运算),field_list为需要排除的字段。
cut -f field_list filename --complement eg.
[1]提取file文件中除了第2列和第3列以外的列
cut -f 2,3 file --complement
(3)指定定界符 -d
cut -f field_list -d delimiter filename eg.
[1]file文件中的每一字段由分号隔开,提取第2个字段
cut -f 2 -d ";" file
(4)将一串字符作为字段来显示
记法 | 范围 | N- | 从第N个字节、字符或字段 到 行尾
| N-M | 从第N个字节、字符或字段 到 第M个(包括第M个在内)字节、字符或者字段
| -M
| 第1个字节、字符或字段 到 第M个(包括第M个在内)字节、字符或字段 | eg.
[1]打印文件中的第3到第5个字符
cut -c 3-5 file [2]打印文件中的前2个字符
cut -c -2 file [3]提取多个字段是,使用--output-delimiter 指定定界符,否则不能区分多个字段
cut -c 3-5,6-9 file --output-delimiter "," |
|
|