设为首页 收藏本站
查看: 880|回复: 0

[经验分享] Perl的Excel读写问题

[复制链接]

尚未签到

发表于 2018-8-31 13:25:50 | 显示全部楼层 |阅读模式
  老有人问我 excel 中文乱码的问题,
  
我平时很少接触这一块,
  
每次都得从头研究,
  
现在把结论记录在这里,以做备忘。
  

  
读:
  


  • use strict;
  • use warnings;

  • use Spreadsheet::ParseExcel;
  • use MyExcelFormatter;

  • my $file = 'foo.xls';

  • my $fmt = new MyExcelFormatter();

  • my $xls = Spreadsheet::ParseExcel::Workbook->Parse( $file, $fmt );
  • my @workSheet = @{ $xls->{Worksheet} };
  • foreach my $sheet ( @workSheet ){
  •     my $sheetName = $sheet->get_name();
  •     print "工作表: $sheetName\n";

  •     my ( $minRow, $maxRow ) = $sheet->row_range();
  •     my ( $minCol, $maxCol ) = $sheet->col_range();

  •     foreach my $row ( $minRow .. $maxRow ){
  •         foreach my $col ( $minCol .. $maxCol ){
  •             my $cell = $sheet->get_cell( $row, $col );
  •             next unless $cell;
  •             print " ($row,$col) ", $cell->value;
  •         }
  •         print "\n";
  •     }
  • }
  

  基本上上面这段代码就是从 Spreadsheet::ParseExcel 的文档里抄来的。
  
除了 my $fmt = new MyExcelFormatter(); 这一行之外。
  
这一行生成了一个文档内容的转换器(格式化工具),
  
转换器代码如下:
  


  • package MyExcelFormatter;

  • use strict;
  • use warnings;

  • use base qw(Spreadsheet::ParseExcel::FmtDefault);

  • use Encode::CN;
  • use Encode qw(from_to);

  • sub new() {
  •     return bless {};
  • }

  • sub TextFmt( $;$ ) {
  •     my $this = shift;
  •     my ($value, $code) = @_;

  •     if ( defined $code and $code eq 'ucs2' ){
  •         from_to( $value, 'ucs2', 'gb2312' );
  •     }
  •     return $value;
  • }

  

  如法炮制以此类推,可以处理所有本地语言编码。
  

  
写 excel,这个就更简单了:
  


  • use strict;
  • use warnings;

  • use Spreadsheet::WriteExcel;

  • my $workbook = new Spreadsheet::WriteExcel( 'foo.xls' );
  • my $worksheet = $workbook->add_worksheet( T('世界你好') );

  • $worksheet->write( 0, 0, T('干啥呢') );
  

  大家可以看到,完全就是抄 perldoc 文档里的例子的。
  
只不过,T( '世界你好' ) 看上去有点怪怪的罢了。
  
其实这是一个自定义函数:
  


  • use Encode qw(decode);

  • sub T {
  •     my $text = shift;

  •     return decode( 'gb2312', $text );
  • }
  

  名字当然也可以不叫 T,叫别的也行。
  
完整的代码如下:
  


  • use strict;
  • use warnings;

  • use Spreadsheet::WriteExcel;
  • use Encode qw(decode);

  • my $workbook = new Spreadsheet::WriteExcel( 'foo.xls' );
  • my $worksheet = $workbook->add_worksheet( T('世界你好') );

  • $worksheet->write( 0, 0, T('干啥呢') );

  • sub T {
  •     my $text = shift;

  •     return decode( 'gb2312', $text );
  • }
  

  最后再来个总结:
  
要点只有一个:excel 里保存的是且只能是 utf8 编码,而简体中文版的 windows 控制台和其它一些软件缺省显示的是 gb2312 编码
  
有些朋友在 tk 应用或者 mysql 应用中用了上面的代码,仍然看到乱码,那是因为你没有搞明白 tk 和 mysql 的编码,所以上面的办法也不是万能的。
  
万能的办法就是搞清楚每个信息流的编码方案,彻底把思路搞明白了。



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-559417-1-1.html 上篇帖子: perl实现16进制数转换成10进制数 下篇帖子: perl监控目录变化
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表