设为首页 收藏本站
查看: 1429|回复: 0

[经验分享] python的一些模块

[复制链接]

尚未签到

发表于 2018-8-16 06:40:21 | 显示全部楼层 |阅读模式
  urllib和urllib2
  urllib和urllib2都是接受URL请求的相关模块,但是提供了不同的功能;
  urllib和urllib2 这两个模块并不可以互相替补;
  urllib2 可以接受一个Request类的实例来设置URL请求的header,urllib仅可以接受URL。这就意味着你不可以伪装你的User Agent字符串等
  urllib提供的urlencode方法用来GET查询字符串的产生,而urllib2没有。这就是为何urllib和urllib2一起使用的的原因。
  urllib2拥有很多urllib所没有的特性:
  1、urllib不支持缓存,urllib2支持
  2、urllib不支持最后修改时间检查,urllib2支持
  3,、urllib不支持ETag,urllib2支持
  4、urllib不支持压缩,urllib2支持
  5、urllib将所有的重定向都当所临时重定向,urllib2支持区分临时重定向和永久重定向。(重定向:通过各种方法将各种网络请求重新定位到其他位置)
  反正urllib就是一个基本的http库,而urllib2对http协议的支持更加完善
  BeautifulSoup的简介
  Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间
  简单来说,BeautifulSoup是python的一个库,最主要的功能是从网页抓取数据,官方的解释如下:
  BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱、通过解析文档为用户提供需要抓取的数据,因为简单、所以不需要多少代码就可以写出一个完整的应用程序。
  BeautifuSoup自动输入文档转换为Unicode编码,输入文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时BeautifulSoup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。
  BeautifulSoup已成为和lxml、html6lib一样出色的python解释器、为用户灵活地提供不同的解析策略或强劲的速度
  python的正则表达式re模块
  正则表达式是一个小巧的,高度专业化的编程语言,它内嵌于python的开发语言中,可通过re模块使用,
  正则表达式使用单个字符来描述、匹配一系列符合某个句法规则的字符串。
  Requests模块
  Requests使用的是urllib3,因此继承了它的所有的特性。Requests支持HTTP连接保持和连接池。支持cookie保护会话,支持文件上传,支持自动确定响应内容的编码。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-552346-1-1.html 上篇帖子: RHEL安装python2.7.12-testing 下篇帖子: python爬虫的一些基本技巧
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表