设为首页 收藏本站
查看: 572|回复: 0

[经验分享] PHP小偷原理

[复制链接]

尚未签到

发表于 2017-3-21 08:51:45 | 显示全部楼层 |阅读模式
  snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务。
  官方网站 http://snoopy.sourceforge.net/
  
    下面是它的一些特征:
1、方便抓取网页的内容
2、方便抓取网页的文字(去掉HTML代码)
3、方便抓取网页的链接
4、支持代理主机
5、支持基本的用户/密码认证模式
6、支持自定义用户agent,referer,cookies和header内容
7、支持浏览器转向,并能控制转向深度
8、能把网页中的链接扩展成高质量的url(默认)
9、方便提交数据并且获取返回值
10、支持跟踪HTML框架(v0.92增加)
11、支持再转向的时候传递cookies
  
下面是简单的例子,比如说我们抓取百度的文字

<?php
include  "Snoopy.class.php" ;
$snoopy  = new  Snoopy ;
$snoopy -> fetchtext ( "http://www.baidu.com" );
echo  $snoopy -> results ;
echo "<br/><font color='red'>上面是抓取网址上面的文字,下面这个却是抓取网址上面的链接地址</font><br/>";
$snoopy -> fetchlinks("http://www.baidu.com");
print_r( $snoopy -> results);
?>

  运行出的结果为:

百度一下,你就知道 body{margin:4px 0}p{margin:0;padding:0}img{border:0}td,p,#u{font-size:12px}#b,#u,#l td,a{font-family:arial}#kw{font:16px Verdana;height:1.78em;padding-top:2px}#b{height:30px;padding-top:4px}#b,#b a{color:#77c}#u{padding-right:10px;line-height:19px;text-align:right;margin:0 0 3px !important;margin:0 0 10px}#sb{height:2em;width:5.6em}#km{height:50px}#l{margin:0 0 5px 15px}#l td{padding-left:107px}p,table{width:650px;border:0}#l td,#sb,#km{font-size:14px}#l a,#l b{margin-right:1.14em}a{color:#00c}a:active{color:#f60}#hp{position:absolute;margin-left:6px}#lg{margin:-26px 0 -44px}#lk{width:auto;line-height:18px;vertical-align:top}form{position:relative;z-index:9} 登录新 闻网 页贴 吧知 道MP3图 片视 频设置高级空间 hao123 | 更多>> 把百度设为主页加入百度推广 | 搜索风云榜 | 关于百度 | About Baidu?009 Baidu 使用百度前必读 京ICP证030173号
上面是抓取网址上面的文字,下面这个却是抓取网址上面的链接地址Array ( [0] => http://passport.baidu.com/?login&tpl=mn [1] => http://news.baidu.com [2] => http://tieba.baidu.com [3] => http://zhidao.baidu.com [4] => http://mp3.baidu.com [5] => http://image.baidu.com [6] => http://video.baidu.com [7] => http://www.baidu.com/gaoji/preferences.html [8] => http://www.baidu.com/gaoji/advanced.html [9] => http://hi.baidu.com [10] => http://www.hao123.com [11] => http://www.baidu.com/more/ [12] => http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com [13] => http://e.baidu.com [14] => http://top.baidu.com [15] => http://home.baidu.com [16] => http://ir.baidu.com [17] => http://www.baidu.com/duty/ [18] => http://www.miibeian.gov.cn )

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-352749-1-1.html 上篇帖子: php加密概述 下篇帖子: php笔记(待续……)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表