php 正则对于中文汉字字符的提取

升木发表于 2018-12-20 14:20:51

　　正则是个好东西正则不光可以对英语字符特殊字符进行提取对于中文字符日语字符等等都可以提取再也不要用（.*?）来匹配了而且也不准确！

　　放在例子先：取出下面字符中的所有中文字符：

$str = "这%里是^测&试*中$心，欢.迎e你4的6到k来，我r们a呜呜呜we这y里w安安生生et一ef直在努力gr着找寻啊啊最佳gr的伙伴，希望您的$$%加盟可以@推动他们GH团队高速发展!";
$code = "/[".chr(0xa1)."-".chr(0xff)."]+/";
preg_match_all($code,$str, $arr); //GB2312汉字字母数字下划线正则表达式
print_r($arr);　　取出结果如下：
http://s3.运维网.com/wyfs02/M02/48/BB/wKiom1QLMAiBoEpBAAD-pVvG8Qk698.jpg
　　需要注意的这个是GBK的
　　下面再给出一个utf8的案例：
if (preg_match('/^[\x{4e00}-\x{9fa5}]+$/u', '中华人民共和国')){
echo '全是汉字';
}else{
echo '不全是汉字';
}
// 打印出 "全是汉字"

if (preg_match('/^[\x{4e00}-\x{9fa5}]+$/u', '中国 china')){
echo '全是汉字';
}else{
echo '不全是汉字';
}
//打印出"不全是汉字"，　　然后再在网上找到这么一段代码大家可以看看：

array(3) {
=>
array(3) {
=>
string(23) "cn网站制作学习网"
=>
string(20) "cn正则获取中文"
=>
string(15) "php获取中文"
}
=>
array(3) {
=>
string(2) "cn"
=>
string(2) "cn"
=>
string(3) "php"
}
=>
array(3) {
=>
string(21) "网站制作学习网hidden_content$"
=>
string(18) "正则获取中文"
=>
string(12) "获取中文"
}
}　　

页: [1]

运维网's Archiver

php 正则对于中文汉字字符的提取