Python爬虫实现抓取网页图片

sdfwe 发表于 2015-11-5 09:16:35

在逛贴吧的时候看见贴吧里面漂亮的图片，或有漂亮妹纸的图片，是不是想保存下来？
但是有的网页的图片比较多，一个个保存下来比较麻烦。
最近在学Python，所以用Python来抓取网页内容还是比较方便的:
所以就尝试了一下

------code-------

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#coding=utf-8

import re
import urllib //导入模块

def gethtml(url): //自定义函数，传参获取网页内容
page=urllib.urlopen(url)
html=page.read()
return html

def getimg(html): //自定义函数，获取需要的内容

reg=r'src="(.+?\.jpg)" pic_ext' //正则表达式，抓取图片链接，见html.jpg
imgre=re.compile(reg)       //把正则表达式编译成一个正则表达式对象,以提高抓取效率
imglist=re.findall(imgre,html)//获取html中所有匹配到的正则表达式对象
x=1
for imgurl in imglist:       //循环遍历整个链接列表
   urllib.urlretrieve(imgurl,'f:\\myimg\\myimage\\ %s.jpg' % x) //保存图片至目标文件夹
   x=x+1

html=gethtml("//要获取的网页链接
print getimg(html)

-----------------------------------

图示:

如果有疑问
请下载图示图片查看
我用的是猎豹浏览器

页: [1]

运维网's Archiver

Python爬虫实现抓取网页图片