Matthewl 发表于 2015-4-23 10:15:29

Chrome + Python 抓取动态网页内容

  用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:



import urllib2
url="http://mm.taobao.com/json/request_top_list.htm?type=0&page=1"
up=urllib2.urlopen(url)#打开目标页面,存入变量up

cont=up.read()#从up中读入该HTML文件

key1='
页: [1]
查看完整版本: Chrome + Python 抓取动态网页内容