arongsoft 发表于 2017-4-5 10:55:58

使用PHP 開源類來分析HTML

  Sourceforge上有一个PHP的分析类,可以从这里下载
。  


    采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。
  請參考 http://simplehtmldom.sourceforge.net/

  特色

  

1. 只支持PHP5以上

2. 可以分析不怎么严谨(invalid)的HTML代码

3. 支持简单的CSS Selector.

4. 支持简单的DOM操作

5. 保持HTML中的原始格式





$html = file_get_html($url);
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';

// Find all links
foreach($html->find('a') as $element){
/* 出來的效果大概是這樣
http://www.phpfans.net/manu/javascript/    a   
<a href="http://www.phpfans.net/manu/javascript/" target="_blank">javascript 手册</a>   
javascript 手册    javascript 手册
<br>http://www.phpchina.com/    a    <a href="http://www.phpchina.com/" target="_blank">PHPChina</a>    PHPChina    PHPChina<br>
http://www.phpfans.net/    a    <a href="http://www.phpfans.net/" target="_blank">php爱好者</a>    php爱好者    php爱好者 <br>http://www.phpv.net/    a    <a href="http://www.phpv.net/" target="_blank">PHP5研究室</a>    PHP5研究室    PHP5研究室<br><br> <br>http://www.phpx.co
*/
echo $element->href .'    '. $element->tag
.'    '. $element->outertext .'    '. $element->innertext .'    '. $element->plaintext .'<br>';
}
     deme頁:  http://wasa.sinaapp.com/demo/curl.php








參考轉載于 : 使用PHP简单分析HTML
页: [1]
查看完整版本: 使用PHP 開源類來分析HTML