PHP判断字符集并转码的函数(转)

慧9建 · 发表于 2017-4-10 07:31:04

　　来源：http://hudeyong926.iteye.com/blog/1127196
　　===========================================================
　　原理很简单，因为gb2312/gbk是中文两字节，这两个字节是有取值范围的，而utf-8中汉字是三字节，同样每个字节也有取值范围。而英文不管在何种编码情况下，都是小于128，只占用一个字节（全角除外）。

如果是文件形式的编码检查，还可以直接check utf-8的BOM信息。话不多说，直接上函数，这个函数是用来对字符串进行检查和转码的。

<?php
function safeEncoding($string,$outEncoding ='UTF-8'){
$encoding = "UTF-8";
for($i=0;$i<strlen($string);$i++) {
if(ord($string{$i})<128)
continue;
if((ord($string{$i})&224)==224) {
//第一个字节判断通过
$char = $string{++$i};
if((ord($char)&128)==128) {
//第二个字节判断通过
$char = $string{++$i};
if((ord($char)&128)==128) {
$encoding = "UTF-8";
break;
}
}
}
if((ord($string{$i})&192)==192) {
//第一个字节判断通过
$char = $string{++$i};
if((ord($char)&128)==128) {
// 第二个字节判断通过
$encoding = "GB2312";
break;
}
}
}
if(strtoupper($encoding) == strtoupper($outEncoding))
return $string;
else
return iconv($encoding,$outEncoding,$string);
}
?>
　　=================================================
　　另外有一种方法也很巧妙：

function getSafeCode($value){
$value_1= $value;
$value_2 = @iconv("utf-8","gb2312",$value_1);
$value_3 = @iconv("gb2312","utf-8",$value_2);
if (strlen($value_1) == strlen($value_3)){
return $value_2;
}else{
return $value_1;
}
}

账号		自动登录	找回密码
密码			立即注册

Centos6.5×64安装配置openmeetings3.0.3详

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

[经验分享] PHP判断字符集并转码的函数(转)

浏览过的版块

扫码加入运维网微信交流群