设为首页 收藏本站
查看: 1144|回复: 0

[经验分享] Python爬虫入门 | 1 Python环境的安装

[复制链接]

尚未签到

发表于 2018-8-4 11:16:37 | 显示全部楼层 |阅读模式
  这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~
  话不多说,正式开始我们的第一节课《Python环境的安装》吧~
  啦啦啦开课啦,看黑板,都看黑板~

  • 安装Anaconda
  在我们的教学中,我们使用的版本是Python3,至于为什么要选Python3,哼哼!
DSC0000.jpg

  工欲善其事,必先利其器,在学习爬虫之前,你得先搭建自己的编程环境。废话不多说,按照下面的方法搭建吧:
  1.1 下载Anaconda
  打开Anaconda网页后,看到这样的页面:
DSC0001.jpg

  根据你的电脑系统,选择相应版本的 Anaconda(记住选择 Python 3.6 的版本),Mac OS 用户选择 Mac 版本即可,如果不想麻烦,请选择  Graphical Installer。
  1.2 安装 Anaconda
  选择默认位置安装即可:
DSC0002.jpg

  两个选择框都勾上,安装:
DSC0003.jpg

  1.3 在开始菜单中查看 Anaconda
  Anaconda 装好之后,可以在开始菜单查看。可以看到包含了如下图所示的组件:
DSC0004.jpg

  之后我们会用到的主要是:
  Anaconda Prompt:Anaconda 自带的命令行

  Jupyter Notebook:一个简单易用、适合入门的>

  • 安装常用包
  2.1 安装 Python 包 requests
  打开 cmd 终端,输入 pip install requests,若安装不成功,可以尝试:conda install requests
DSC0005.jpg

  requests,未出现报错,表示安装成功,可以正常使用。注:操作完记得退出:quit()。
  如果安装时显示 conda 不是内部或外部命令,用下面的方式安装(如未报错则不必用下面的方法)
  在开始菜单打开 Anaconda Prompt:
DSC0006.jpg

  在 Anaconda Prompt 输入 conda install requests:
DSC0007.jpg

  2.2 安装 Python 包 lxml
  同样在终端输入: conda install lxml,出现 Successfully installed,即表示成功安装,若不能成功安装,请尝试如下方法。
  前往 http://www.lfd.uci.edu/~gohlke/pythonlibs/,手动下载需要安装的第三方包(注意对应你的python版本是32位还是64位)。
DSC0008.jpg

  在下载下来的文件所在目录按住shift并点击鼠标右键,选择在此处打开Powershell窗口,在此命令行中使用 pip install + 下载下来文件全名 ,即可完成安装。
DSC0009.jpg

  所以你该知道如何安装 Python 包了吧,通用方法是,在终端输入:conda install + 包名称   或者   pip install + 包名称。出现特殊的不能安装的情况,可以去下载之后进行安装。

  • Jupyter Notebook
  3.1 开启Jupyter Notebook
  在开始菜单打开 Jupyter Notebook:
DSC00010.jpg

  Jupyter 将会在网页中自动打开:
DSC00011.jpg

  3.2 Jupyter Notebook 界面
  Files:你当前工作环境下的所有项目(代码)、默认存储的文件都在这里:
DSC00012.jpg

  Runing:你目前正在运行的项目都在这里:
DSC00013.jpg

  3.3 新建一个文档,开始写代码
  依次点击右上方 :New > Python 3,即新建了一个 Ipython 文件,如图:
DSC00014.jpg

  点击上方 Utitled 可以更改文档的名称,下面的空间就可以写代码啦:
DSC00015.jpg

  3.4 Jupyter Notebook 功能简介
DSC00016.jpg


  • 创建第一个实例:爬取百度首页
  仅用四行代码,我们就可以把百度首页的内容下载下来:
  1.导入 requests 库;2.下载百度首页内容;3.更改编码;4.打印内容
DSC00017.jpg

  具体爬虫原理及代码的内涵,在下一节的案例中详细讲解~
  好了,这节课就到这里
DSC00018.jpg

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-546401-1-1.html 上篇帖子: python 将python程序编译成可执行文件 下篇帖子: Python压缩/解压gzip大文件
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表