使用php的DOM函数,解析网页元素
此例用php的dom库解析百度首页的所有链接:$doc = new DOMDocument();
@$doc->loadHTMLFile("http://www.baidu.com/");
$as=$doc->getElementsByTagName("a");
foreach($as as $node){
if(($value=$node->nodeValue)!=''){
print $value."=====";
print $node->getAttributeNode("href")->value;
echo "<br>";
}
}
注:由于使用的是中文的帮助手册,有些类和方法属性涵盖不全,所以短短的代码却费了不少的功夫(幸好了解一些javascript,其实语言这东西思想都是相通的),建议去官方网站下载最新的英文帮助手册。
关于对网页进行深度搜索或广度搜索可以将该方法置于循环中或对其递归,通过动态设定循环次数即可实现,以免进入无限制搜索的局面。
页:
[1]