风起漂泊 发表于 2017-4-10 06:24:35

PHP小记|中英混合字符串截取

  常常在WEB页面显示记录列表的时候需要对过长内容进行截取。
  采用PHP内置的substr函数对中英混合字符串,特别是字符编码在UTF-8的情况下,支持非常不好,会出现乱码。
  所以自己写了一个函数:

function truncate($string, $len, $wordsafe = FALSE) {
$slen = strlen($string);
if ($slen <= $len) {
return $string;
}
if ($wordsafe) {
while (($string[-- $len] != ' ') && ($len > 0)) {
};
}
if ((ord($string[$len]) < 0x80) || (ord($string[$len]) >= 0xC0)) {
return substr($string, 0, $len) . "...";
}
while (ord($string[-- $len]) < 0xC0) {
};
return substr($string, 0, $len) . "...";
}
  经测试成功。YEAH!
  =======================================================================
  2012-06-15更新:
  今天再次写了一个,好处是会把两个英文字符当作一个汉字字符的长度:
  所以传递的需要截取多少个汉字的长度

function truncate($string, $len, $cnCharWidth = 2) {
$len = $len * $cnCharWidth;
$suffix = "...";
$newStr = "";
for ($i = 0, $j = 0; $i < $len; $i++, $j++) {
if (!isset($string[$j])) {
$suffix = "";
break;
}
$start = $j;
while ($j < ($start +3) && !(ord($string[$j]) < 0x80)) {
$j++;
}
if ($start == $j) {
$charLen = 1;
}
else {
$i = $i + 1;
$j--;
$charLen = 3;
}
$newStr .= substr($string, $start, $charLen);
}
return $newStr . $suffix;
}
页: [1]
查看完整版本: PHP小记|中英混合字符串截取