设为首页 收藏本站
查看: 1057|回复: 0

[经验分享] Perl帮MM轻松搞定Excel数据

[复制链接]

尚未签到

发表于 2018-9-1 06:44:04 | 显示全部楼层 |阅读模式
  某日,与公司海外推广部MM聊天。MM在与我一边聊天的同时,还一边处理着手头上的工作。于是,我好奇的问了一下MM的工作情况。她告诉我她现在正在处理一个excel文件,此文件中密密麻麻的记录着一些信息。有一列中完全是公司某一网站的的url,类似于这样
  

DSC0000.png

  她说,她要逐个点击其中的url地址,并在IE中查看该url中下面项的值
  

DSC0001.png

  当Wholesale price (如上图)所在行的us$后面值大于20时,就将该url记录下来(MM的本意是只要Wholesale price 后面的us$后面的值大于20时,即将该行标注成红色,这里稍微修改一下)。起初,MM是click one by one,该文件中此类的url不下100个,MM手都点酸了,眼也看花了,终于把工作做完了。之后,我说,你就是这样天天工作的呀,不烦才怪呢,效率不高不说,而且容易出错。好了吧,GG我帮你写个程序,这样的工作怎么能由MM的纤纤玉手亲自来做呢,一切交给电脑来处理吧。
  要用perl来处理这个问题,需要用到两个module,一个是LWP::Simple,另一个则是Spreadsheet::ParseExcel,初次不知道怎么用的,请perldoc modulename.
  这里附上perl 代码
  


  • #!/usr/bin/perl -w

  • use strict;
  • use LWP::Simple;
  • use Spreadsheet::ParseExcel;

  • my @array;

  • my $parser   = Spreadsheet::ParseExcel->new();
  • my $workbook = $parser->parse('第二期统计.xls');

  • if ( !defined $workbook ) {
  •     die $parser->error(),".\n";
  • }

  • for my $worksheet ( $workbook->worksheets() ) {

  •     my ( $row_min,$row_max ) = $worksheet->row_range();

  •     #本来下面一句应该是这样写的
  • #for my $row ( $row_min..$row_max ),之所以换成2,是因为想过滤掉第一行中的那几个中文字符,哈哈
  •     for my $row ( 2..$row_max ) {

  •         #下面一句换成1的目的是为了与第二列数据相匹配
  •         my $cell = $worksheet->get_cell( $row,1 );
  •         next unless $cell;

  •         my $tmp_url = $cell->value();
  •         push @array,$tmp_url;

  •     }

  • }

  • for my $url ( @array ) {

  •     my $content = get $url or die "can't get $url\n";
  •     print $url,"\n";

  •     if ( $content =~ /wholesale_price/ ) {
  •         $content =~ m{US\$\s+(\d+.\d+)};

  •         open RES,'>>','results.txt' or die "$!\n";

  •         if ( $1 > 20 ) {
  •             print "$url\n";
  •             print RES "$url\n";
  •         }

  •         close RES;

  •     }

  • }
  

  
结果在results.txt中
  


  • [root@web ~]# cat results.txt
  • http://www.wholesale-dress.net/lapel-long-sleeve-single-button-front-suit-light-grey-g1158909.html
  • http://www.wholesale-dress.net/korea-style-zipped-stand-collar-jacket-khaki-g1228884.html



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-560265-1-1.html 上篇帖子: Ubuntu Server最佳方案——LAMP服务器之Perl篇 下篇帖子: Perl邮件报警 for PHPIDS
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表