yinian 发表于 2018-12-21 11:50:40

php网页采集功能

  我要获取这里的所有列表名称和列表url地址。
phpquery有多种初始化的方法,这里我用:
  下载:http://code.google.com/p/phpquery/downloads/list


这样就完成了。不过采集需要注意的是编码问题。如不注意则有些生僻字则获取不到。
如上网页的编码是gb2312,而我的是utf-8则需要转码一下。

$content['txt']= iconv('gb2312','utf-8',$content['txt'] );   //但是这样还是有很多字符丢失了。。搞了半天才明白。。这有关字符大小的关系。gb2312
页: [1]
查看完整版本: php网页采集功能