lijm1522 发表于 2017-4-26 11:20:58

python网络爬虫抓取图片

  利用python抓取网络图片的步骤:
  1.根据给定的网址获取网页源代码
  2.利用正则表达式把源代码中的图片地址过滤出来
  3.根据过滤出来的图片地址下载网络图片
  

import re
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = imgre.findall(html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x = x + 1      
html = getHtml("http://tieba.baidu.com/p/2460150866")
getImg(html)
页: [1]
查看完整版本: python网络爬虫抓取图片