设为首页 收藏本站
查看: 2031|回复: 0

[经验分享] Python爬虫入门 | 3 爬虫必备Python知识

[复制链接]

尚未签到

发表于 2018-8-5 11:57:34 | 显示全部楼层 |阅读模式
  这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~
  好啦,正式开始我们的第三节课《爬虫必备Python知识》吧!啦啦哩啦啦,都看黑板~

  • 字符串(string)
  1.1 输入字符串
  编写字符串时,既可以用单引号( ' )也可以用双引号( " ):
DSC0000.jpg

  对于带有换行符的多行字符串,可以使用三重引号(即 ''' 或 """ ):
DSC0001.jpg

  1.2 访问字符串中的值
  Python访问子字符串,可以使用方括号来截取字符串,如下实例:
DSC0002.jpg

  以上实例执行结果:
DSC0003.jpg

  1.3 字符串的修改
  Python中已存在的字符串本身不可以改变:
DSC0004.jpg

  报错:
DSC0005.jpg

  但可以对已存在的字符串进行修改,然后赋值给另一个变量:
DSC0006.jpg

  以上实例执行结果:
DSC0007.jpg

  1.4 Python对象转为字符串
  许多Python对象都可以用str函数转换为字符串:
DSC0008.jpg

  以上实例执行结果:
DSC0009.jpg

  1.5 字符串当做序列类型处理
  由于字符串其实是一串字符序列,因此可以被当做某种序列类型(如列表、元组等)进行处理:
DSC00010.jpg

  以上实例执行结果:
DSC00011.jpg

  1.6 Python转义字符
  当需要在字符中使用特殊字符时,Python用反斜杠()转义字符,如下表:
DSC00012.jpg

  1.7 字符串运算符
  下表实例变量 a 值为字符串 "Hello",b 变量值为 "Python":
DSC00013.jpg

  1.8 字符串常用方法
DSC00014.jpg


  • 元组(tuple)
  2.1 元组的创建
  元组(tuple)是一种一维的、定长的、不可变的Python对象序列。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可:
DSC00015.jpg

  创建空元组:
DSC00016.jpg

  元组中只包含一个元素时,需要在元素后面添加逗号:
DSC00017.jpg

  通过调用tuple,任何序列或迭代器都可以被转化为元组:
DSC00018.jpg

  结果为:
DSC00019.jpg

  2.2 访问元组
  元组可以使用下标索引来访问元组中的值,如下实例:
DSC00020.jpg

  以上实例输出结果:
DSC00021.jpg

  2.3 修改元组
  元组中的元素值是不允许修改的,但我们可以对元组进行连接组合,如下实例:
DSC00022.jpg

  结果为:
DSC00023.jpg

  2.4 元组运算符
  与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。
DSC00024.jpg

  2.5 元组索引与截取
  因为元组也是一个序列,所以我们可以访问元组中的指定位置的元素,也可以截取索引中的一段元素,如下所示:
  元组:
DSC00025.jpg

DSC00026.jpg

  2.6 元组内置函数
DSC00027.jpg


  • 列表(list)
  3.1 列表的创建
  跟元组相比,列表(list)是变长的,而且其内容也是可以修改的。它可以通过方括号([ ])或者list函数进行定义:
DSC00028.jpg

  结果为:
DSC00029.jpg

  对已经定义的列表中的内容进行修改:
DSC00030.jpg

  结果为:
DSC00031.jpg

  3.2 访问列表中的值
  使用下标索引来访问列表中的值,同样也可以使用方括号的形式截取字符,如下所示:
DSC00032.jpg

  结果为:
DSC00033.jpg

  3.3 更新列表
  可以对列表的数据项进行修改或更新,也可以使用append()方法来添加列表项,如下所示:
DSC00034.jpg

  结果为:
DSC00035.jpg

  3.4 删除列表元素
  可以使用 del 语句来删除列表的的元素,如下实例:
DSC00036.jpg

  结果为:
DSC00037.jpg

  3.5 判断列表中是否存在某个值
  通过 in 关键字,可以判断列表中是否含有某个值:
DSC00038.jpg

  结果为:
DSC00039.jpg

  3.6 列表脚本操作符
  列表对 + 和 的操作符与字符串相似。+ 号用于组合列表, 号用于重复列表。
DSC00040.jpg

  3.7 列表截取
  Python的列表截取与字符串操作类型,如下所示:
DSC00041.jpg

  3.8 列表内置函数&方法
DSC00042.jpg


  • 字典(dict)
  4.1 字典的创建
  字典是另一种可变容器模型,且可存储任意类型对象。
  字典的每个键值(key=>value)对用冒号( : )分割,每个对之间用逗号( , )分割,整个字典包括在花括号( {} )中 ,格式如下所示:
DSC00043.jpg

  键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串、数字或元组。
  一个简单的字典实例:
DSC00044.jpg

  也可如此创建字典:
DSC00045.jpg

  4.2 访问字典里的值
  把相应的键放入方括弧,如下实例:
DSC00046.jpg

  以上实例输出结果:
DSC00047.jpg

  如果用字典里没有的键访问数据,会输出错误如下:
DSC00048.jpg

  以上实例输出结果:
DSC00049.jpg

  4.3 修改字典
  向字典添加新内容的方法是增加新的键/值对,修改或删除已有键/值对如下实例:
DSC00050.jpg

  以上实例输出结果:
DSC00051.jpg

  4.4 删除字典元素
  del 能删单一的元素也能删除字典,clear 可以清空字典。del删除字典和clear清空字典的区别在于,前者是将字典整个删除了,字典不复存在,而后者是清空字典中的内容,留下了一个“空壳子”。
DSC00052.jpg

  4.5 字典内置函数&方法
DSC00053.jpg


  • 条件控制
  5.1 条件控制流程
  Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:
DSC00054.jpg

  5.2 if 语句
  Python中if语句的一般形式如下所示:
DSC00055.jpg

  如果"condition_1"为True,将执行 "statement_block_1"块语句
  如果"condition_1"为False,将判断 "condition_2"
  如果"condition_2"为True,将执行 "statement_block_2"块语句
  如果"condition_2"为False,将执行"statement_block_3"块语句
  注意:
  1.每个条件后面要使用冒号(:),表示接下来是满足条件后要执行的语句块。
  2.使用缩进来划分语句块,相同缩进数的语句在一起组成一个语句块。
  3.在Python中没有switch – case语句。
  举一个 if 实例:
DSC00056.jpg

  执行程序,输入狗狗的年龄:
DSC00057.jpg

  程序运行结果:
DSC00058.jpg

  输入enter后退出程序。
  5.3 常用操作运算符
DSC00059.jpg

  5.4 if 嵌套
  在嵌套 if 语句中,可以把 if...elif...else结构放在另外一个 if...elif...else 结构中。
DSC00060.jpg

  举一个 if 嵌套实例:
DSC00061.jpg

  输入语句及结果如下:
DSC00062.jpg


  • 循环语句
  6.1 循环语句流程
  Python中的循环语句有 for 和 while。Python循环语句的控制结构图如下所示:
DSC00063.jpg

  6.2 while 循环
  Python中while语句的一般形式:
DSC00064.jpg

  同样需要注意冒号和缩进。以下实例使用了 while 来计算 1 到 100 的总和:
DSC00065.jpg

  执行结果如下:
DSC00066.jpg

  执行以上脚本,输出结果如下:
DSC00067.jpg

  6.3 for 语句
  for 循环的一般格式如下:
DSC00068.jpg

  for 实例中使用 break 语句,break 语句用于跳出当前循环体:
DSC00069.jpg

  结果如下:
DSC00070.jpg

  除了在 for 和 while 的循环体中使用 break 语句来跳出循环,我们还可以使用 continue 语句,continue语句被用来告诉Python跳过当前循环块中的剩余语句,然后继续进行下一轮循环。
  代码块如下:
DSC00071.jpg

  结果如下:
DSC00072.jpg

  好了,这节课就到这里!
DSC00073.jpg

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-546980-1-1.html 上篇帖子: python try语句如何打印错误行(含execfile) 下篇帖子: Python操作MySQL(一) PyMysql篇
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表