Matthewl 发表于 2018-8-7 10:00:57

python爬取nba今天的信息

➜/test sudo vim nba.py  
#!/usr/bin/python
  
#-*- coding:utf-8 -*-
  
class url:
  
      def __init__(self,url):
  
                self.url = url
  
      def nba(self):
  
                import re
  
                import urllib2
  
                hearders = "User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36"
  
                url = "%s" %(self.url)
  
                par = '2018-01-25.*htm\&quot;>(.*?)</a></li>'
  
                opener = urllib2.build_opener()
  
                opener.addheaders =
  
                urllib2.install_opener(opener)
  
                html = urllib2.urlopen(url).read().decode(&quot;utf-8&quot;)
  
                data = re.findall(par,html)
  
                print type(data)
  
                for i in data:
  
                        print i
  
u = url('https://news.zhibo8.cc/nba/')
  
u.nba()
页: [1]
查看完整版本: python爬取nba今天的信息