设为首页 收藏本站
查看: 833|回复: 0

[经验分享] java调用perl出现编码问题

[复制链接]

尚未签到

发表于 2017-5-18 09:50:13 | 显示全部楼层 |阅读模式
Java和Perl互相调用的编码问题
2010-01-08 15:55
在Java和Perl互相调用的程序中,涉及IO的部分一定要合理处理编码问题。
Windows系统中Java的默认编码是GBK,而Perl默认编码是UTF-8.所以如果不合理处理编码,在进程通信过程中,如果处理的是大字符集,则必然会出现乱码,下面是一套解决方案(分析基于Windows系统):

1. perl可以方便的处理编码,不仅可以在打开I/O描述符时设定I/O编码,而且可以随时更改,并且通过Perl还可以方便地进行编码转换:

PERL CODE
-------------------------------------
use encoding 'gbk';   # 系统默认编码为GBK
use open IN=>':encoding(utf16)';   # 读入文件时认为数据按UTF-16编码,自动根据BOM头判断
open(FH,"test.txt") or die;
while(<FH>) {   # 读入数据时自动从UTF-16转换为标准的UTF-8编码的Perl字符串
    chomp;
    print "$_\n";   # 由于encoding指定了系统默认编码,输出时数据自动从UTF-8转换为GBK
}

#也可以用open的3参数形式指定单个文件句柄的PerlIO层编码,并在输出时手工转换编码:
use Encode;   # 需要使用encode函数实现手工转码
open(FH,"<:encoding(utf16)","test.txt") or die;   # 指定FH句柄的数据为UTF-16编码
while(<FH>) {   # 读入数据同样自动转换为UTF-8
    chomp;
    print encode("gbk",$_),"\n";   # 手动将UTF-8编码字符串转换为GBK编码字符串输出
}

#另外使用binmode可以随时切换某个文件句柄的PerlIO层编码,如:
binmode(FH,":encoding(utf16)");   # 将FH的数据编码置为UTF-16
binmode(FH,":raw");   # 不对FH的数据进行编解码处理
binmode(FH,":utf8");   # 将FH的数据编码置为UTF-8
# [ 更多请参考perl manual ]

--------------------------------------

再使用Java调用Perl的时候可以通过如下方式让Perl的默认编码与Java相同,避免乱码的发生:
use Encode;
# set perl stdard iostream encoding
binmode(STDIN,":encoding(GBK)");
binmode(STDOUT,":encoding(GBK)");

2.Perl中编码转换:

PERL CODE
----------------------
use Encode;
$gb2312_string;
$utf8_string=decode("GB2312",$gb2312_string); #Perl默认编码为utf-8
$big5_string=encode("Big5",$utf8_string); #按Big5编码
----------------------

3.Java中编码的处理:

如果设定好了Perl的编码,那么Java的字符串只需要按默认编码GBK处理即可。
Java设定编码读取文件:
BufferedReader br = new BufferedReader(new InputStreamReader(
                    new FileInputStream(FILEPATH), ENCODING));
使用br.read() br.readLine()读取出来的字符串都会按Java默认编码GBK进行编码。
关于Java中编码探测和编码转换可以参考我的上一篇日志中给出的那几个网址中的相关工具进行处理,不再赘述。

注:
Linux系统中Java的默认编码为ISO-8859-1,为了使程序与平台无关,可以在编译的时候添加 encoding 参数。

参考网址:
http://chaoslawful.bokee.com/839877.html
http://www.ibm.com/developerworks/cn/java/java_chinese/



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-378664-1-1.html 上篇帖子: perl-记录程序后台运行时间 下篇帖子: [Perl文]IO::Socket简介
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表