Perl中正则表达式用法总结
"." 用来匹配任意一个字符的通配符,"\n"换行符除外"*" 用来匹配前面条目出现零次或多次
"+" 用来匹配前面条目出现一次以上
"?" 用来匹配前面条目出现一次或者不出现
"()" 用来对字符串分组,\1 或 \2 可以反向引用括号里的字符串,相应的数字表示对应顺序的捕获组,若要调用()中的捕获组,可用$1,$2依次捕获,也可以用$+{LABEL}标签形式捕获
[*]/(.)\1/ 表示匹配2个连续的字符,比如'aa'
[*]/(\S)\1/ 匹配连续出现2次的非空字符
[*]/(.)(.)\2\1/ 可以匹配'abba'
[*]/(.)\g{1}11/ 可以用\g{N},N为数字来表示反向引用,消除歧义
[*]/(?:bronto)?saurus (steak|burger)/ 圆括号中使用?:表示不对该圆括号的内容进行捕获
[*]/(?\w+) (?:and|or) (?\w+)/用?表示对捕获组的引用
对于自动捕获变量,可以用$&表示匹配到的字符串,$`表示字符串匹配前的字段,$'表示字符串匹配后的字段,也可以分别用${^MATCH},${^PREMATCH},${^POSTMATCH}表示
转义元字符,若要匹配"."号本身,需要使用"\"转义,"\.",对"\"本身匹配,则为"\\"
"|" 表示要么匹配前面,要么匹配后面
[*]/wilma.*fred|fred.*wilma/ 匹配一行中同时出现wilma和fred,前后出现的顺序都要考虑到
"" 表示一个连续的字符集
[*]/+/ 匹配一行中第一个字母大写后面字母小写的字符串
"\d" 表示任意一个数字的字符集,前提是在ASCII字符集中,相反,"\D"表示否定含义,表示非数字
"\s" 匹配任意空白符,相反,"\S"表示匹配非空白符
"\w" 同""字符集,代表单词字符, 相反,"\W"表示非单词字符
模式匹配符"//",事实上等同于"m//","m//"可以替换成"m##","m"等等
默认模式匹配符中匹配的是"$_"变量
"//i",i表示无关大小写的模式匹配
[*]/Fred/i
"//s",s默认转换模式中的点号为字符集[\d\D],因此点号可以匹配换行符
[*]/Barney.*Fred/s 若Barney和Fred之间有换行符则不影响匹配
"//x",x允许在模式中插入任意空白符,增加可读性
[*]/ -? + \.? * /x
"//a", 表示以ASCII字符集的模式匹配
[*]/\w+/a 代表字符集
"//u",表示以unicode字符集的模式匹配
[*]/\w+/u 代表Unicode中定义为单词的字符
"//l",表示以本地化所设定的字符集的模式匹配
[*]/\w+/l 代表locale本地化设定的字符集
"\A" 锚位匹配字符串的绝对开头,
[*]/\Astring/
"\z" 锚位匹配字符串的绝对末尾,"\Z" 允许后面出现换行符
[*]/string\z/
"//m"可以对多行字符串进行匹配,和"$","^"结合使用
[*]/fred$/m 匹配多行字符串中fred结尾的
[*]/^barney/m 匹配多行字符串中barney开头的
"\b" 单词锚位,
[*]/\bFred\b/ 匹配一个独立的单词Fred,前后不能结合其他字符
"=~" 绑定操作符,指定字符串和模式进行匹配,若不用绑定操作符,默认对$_变量进行匹配
[*]string =~ /expr/
可以指定匹配的次数
[*]/a{3,15}/ 匹配a出现的次数为3到15次
[*]/fred{3,}/ 匹配fred出现3次以上
替换的用法举例
[*]$_ = "green scaly dinosaur";
[*]s/(\w+) (\w+)/$2, $1/; 将2个字符串互换位置,换后为"scaly, green dinosaur"
[*]s/^/huge,/; 在开头插入huge,变为"huge,scaly,green dinosaur"
[*]s/,.*een//; 将第一个逗号到green的所有字符都删除,变为"huge dinosaur"
[*]s/\w+$/($`!)$&/; 替换后变为"huge (huge !)dinosaur"
[*]s/\s+(!\W+)/$1 /; 替换后变为"huge (huge!) dinosaur"
[*]s/huge/gigantic/; 替换后变为"gigantic (huge!) dinosaur"
s///g,/g为全局替换
大小写替换
[*]$_ = "I saw Barney with Fred"
[*]s/(Barney|Fred)/\U$1/gi Barney和Fred全部替换为大写字符
[*]s/(Barney|Fred)/\L$1/gi Barney和Fred全部替换为小写字符
[*]s/(\w+) with (\w+)/\U$1\E with $2/ \U仅对$1进行大写替换,加了\E则对$1后的字符串不进行大写替换
split操作符,可以将字段中的以某个特定分隔符分隔开的字符串提取出来并存入列表变量
[*]my @buddy = split /:/, "tom:jerry:nico:kid";则列表@buddy = ("tom", "jerry", "nico", "kid")
[*]$some_string = "This is\ta\t\ttest"; 对以多个空白符分隔的字段
[*]my @str1 = split /\s+/, $some_string; 可以用\s+表示分隔符来对字段提取字符串
join函数,将指定的分隔符插入到不同的字符串中
[*]my $str2 = join "-", 2,3,4,5,6; 得到的变量$str2为"2-3-4-5-6"
页:
[1]