php网页采集功能
我要获取这里的所有列表名称和列表url地址。phpquery有多种初始化的方法,这里我用:
下载:http://code.google.com/p/phpquery/downloads/list
这样就完成了。不过采集需要注意的是编码问题。如不注意则有些生僻字则获取不到。
如上网页的编码是gb2312,而我的是utf-8则需要转码一下。
$content['txt']= iconv('gb2312','utf-8',$content['txt'] ); //但是这样还是有很多字符丢失了。。搞了半天才明白。。这有关字符大小的关系。gb2312
页:
[1]