GBK/GB2312和utf-8字符集:[\x80-\xff]+ 或 [\xa1-\xff]+ 两者字符集都支持(推举GBK利用)
utf-8编码:[\x{4e00}-\x{9fa5}]+/u
例子:
GBK 利用
<?php$str = "学习php是一件快乐的事。";preg_match_all("/[\x80-\xff]+/", $str, $match); //GBK和UTF-8 实行构造都是一样print_r($match);?>
Array ( [0] => Array ( [0] => 学习 [1] => 是一件快乐的事。 ) )
UTF-8 利用:
<?php$str = "学习php是一件快乐的事。";preg_match_all("/[\x{4e00}-\x{9fa5}]+/u", $str, $match); //只能适用于UFT-8字符集print_r($match);?>
输出:
Array([0] => Array([0] => 学习[1] => 是一件快乐的事。))
实例1:如何去除中文(GB2312和utf-8字符集均可以利用)
<?php$string = "中华教具网www.cnjiaju.com";$str = preg_replace('/([\x80-\xff])/i','',$string); //去掉中文汉字echo $str;?>
实例2:(只能适用于uft-8字符集)
$string = "中华教具网www.cnjiaju.com";echo preg_match('/([\x{4e00}-\x{9fa5}])+/u', $string, $match); //1 trueecho $match;/array (0 => '中华教具网',1 => '网',)/
实例3:如何匹配中文(utf-8)
<?php$platform_name = '<li>赶集网 <a href="http://www.ganji.com" target="_blank" rel="nofollow"><font color="#0033CC">http://www.ganji.com</font></a></li>';$count = preg_match_all('/[\x{4e00}-\x{9fa5}]+/u', $platform_name, $mathes); //匹配中文的正则表达式echo $count."<br>"; //匹配的次数var_export($mathes); //匹配的结果?>
js的写法
var reg=/[\u4e00-\u9fa5]+/;<script><script> var str="ftgfg风缘择敏hjkhj"; var reg=/[\u4e00-\u9fa5]+/; if(reg.exec(str)){ alert('有中文'); } else{ alert('没有中文'); }</script>
匹配中文:
javascript:[\u4e00-\u9fa5]PHP: [\x80-\xff] GBK 和 utf-8 兼容利用 推举GBK字符集利用[\x{4e00}-\x{9fa5}] utf-8