plantegg 发表于 2017-5-1 06:23:13

python 提取url中域名

import re
re.compile(r'^(http(s)?://)?([\w-]+\.)+[\w-]+/?')

正则式()表示
(exp) 匹配exp,并捕获文本到自动命名的组里
所以
当url='http://www.360buy.com/product/755411.html'
print p.search(url).group(0) -> http://www.360buy.com/
print p.search(url).group(1) -> http://
print p.search(url).group(2) -> None
print p.search(url).group(3) -> 360buy.
print p.findall(url) -> [('http://', '', '360buy.')]
re的匹配结果为寻找符合()内规则的匹配集合
页: [1]
查看完整版本: python 提取url中域名