loinui 发表于 2015-7-29 10:35:44

python中RE正则匹配模块的用法若干

# -*- coding:utf-8 -*-
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
regexes = ]   # 编译一个匹配模板对象列表,该列表匹配模板编译源来自一个二元列表
text = 'Does this text match the pattern?'
print 'Test:', ' ', text
for regex in regexes:                   # 查找每一个模板对象
    print 'seeking "%s"-->' % regex.pattern,
    if regex.search(text):            # search返回找到的第一个对象,没有找到则为空
      print "match", regex.search(text).string
    else:
      print "no match", regex.search(text)
    print regex.findall(text)         # findall返回找到所有匹配项组成的列表
    # 正则表达式量词,转义字符,字符,锚钉码另见另章

    # python3中匹配默认unicode.python2中默认ASCII。故匹配中文及特殊字符。Python2需特殊处理。
    # 重新加载sys模块,指定默认utf-8。在目标字符串和模板前都加U即可。
source = u"s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3"
xx = u"程序员"
pattern = re.compile(xx)
results = pattern.findall(source)
print results


页: [1]
查看完整版本: python中RE正则匹配模块的用法若干