孤独750 发表于 2017-4-29 12:42:24

python 正则表达式使用笔记

import os,urllib,urllib2
import re,sys
url = "http://www.iteye.com"
page = urllib.urlopen(url).read()
str = re.compile('<script([\S\s]*?)<\/script>')
b = str.sub('',page)
str = re.compile('<.*?>')
b = str.sub('',b)
wordlist = re.findall('{3,}',b)
for aword in wordlist:
print aword
页: [1]
查看完整版本: python 正则表达式使用笔记