mqzlp 发表于 2015-12-27 18:15:21

perl 爬虫研究2

  继续研究云总的代码时,发现很纠结的问题。
  再看代码,试着单月测试的方法研究,始终输出的是数组,
  感觉不会再爱了。。。。先把上午的活干完,晚上飞机走人了。。



#!/usr/bin/perl
use URI::URL;
use Web::Scraper;
use Data::Dumper;
my $base_url="http://www.cnblogs.com/";
my $host=URI::URL->new($base_url)->host;
print "host:$host\n";
$scraper=scraper{ process '//a','links[]'=>'@href';};
print $scraper->scrape( URI->new($base_url))->{'links'};
foreach(@{$res}){
$link=$_->as_string;
$link=URI::URL->new($link,$base_url);
$link = $link->abs->as_string;
if( $link =~ /(.*?)#(.*)/ )
                        {
$link = $1;
}
print Dumper($link);
}
  
页: [1]
查看完整版本: perl 爬虫研究2