5544992 发表于 2015-8-25 10:35:49

代码片段-PHP-UTF8中文字符截断

  今天需要用一个UTF-8的字符串截断函数,网上找了几个代码片段发现都有问题,于是查了一下原理自己写了一个函数,代码片段如下:


View Code


1 <?php
2 /* UTF-8中文字符截断程序 */
3
4
5 $str = "123这是测试字符串";
6 $str1 = "()()";
7 echo subUTF8str($str,0,3)."<br>";
8 echo subUTF8str($str,0,4)."<br>";
9 echo subUTF8str($str1,0,4)."<br>";
10 echo subUTF8str($str1,0,10)."<br>";
11
12 function subUTF8str($str,$start=0,$length=80){
13    $cur_len = 0; //人理解的字符串长度
14    $all_len = strlen($str); //机器理解字符串长度
15    if($length > $all_len)
16    {
17         return $str;
18    }
19    for($i = 0;$i < $all_len;)
20    {
21         if($cur_len == $start)
22         {
23             break;
24         }
25         if (ord($str[$i]) > 127)
26         {
27             $i += 3;
28         }else{
29             $i += 1;
30         }
31         $cur_len ++;
32    }
33   $start_pos = $i;
34   $temp_pos = $cur_len;
35   for(;$cur_len - $temp_pos < $length;)
36   {
37         if($i >= $all_len)
38             break;
39         if (ord($str[$i]) > 127)
40         {
41             $i += 3;
42         }else{
43             $i += 1;
44         }
45         $cur_len ++;
46   }
47   $end_pos = $i;
48   return substr($str,$start_pos,$end_pos);
49 }
50 ?>
  其实,PHP原生就有多charset下字符截取方案,额,所以就是这个样子...囧..
  Multibyte String Functions函数族中,

  string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )用来字符串截取
  int mb_strlen ( string $str [, string $encoding ] )返回字符串长度
  ....
  详细请查看PHP手册
页: [1]
查看完整版本: 代码片段-PHP-UTF8中文字符截断