php正则表达式匹配中文

在php中来判断字符串是否为中文，就会沿袭这个思路：

代码如下	复制代码
<?php $str = "php编程"; if (preg_match("/^[u4e00-u9fa5]+$/",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); } ?>

不过，很快就会发现，php并不支持这样的表达，报错：
Warning: preg_match() [function.preg-match]: Compilation failed: PCRE does not support L, l, N, U,

or u at offset 3 in test.php on line 3

刚开始从google上查了很多次，想从php正则表达式对于十六进制数据的

表达方式上进行突破，发现在php中，是用x表示十六进制数据的。于是，

变换成如下的代码：

代码如下	复制代码
$str = "php编程"; if (preg_match("/^[x4e00-x9fa5]+$/",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); }

貌似不报错了，判断的结果也正确，不过把$str换成“编程”两字，结果却还是显示“该字符串不全部是中文”，看

来这样的判断还是不够准确。

如果要精准匹配中文，即匹配纯中文字符，或匹配中文字符加上全角标点，则需要根据不同编码环境使用不同方法。

下面以两种常用的编码(gb2312,utf-8)

下面给两个例子：

代码如下

复制代码

(1) ANSI编程环境下:

$strtest = “yyg中文字符yyg”;

$pregstr = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";

if(preg_match($pregstr,$strtest,$matchArray)){

echo $matchArray[0];

}

//output:中文字符

(2) Utf-8编程环境下:

$strtest = “yyg中文字符yyg”;

$pregstr = "/[x{4e00}-x{9fa5}]+/u";

if(preg_match($pregstr,$strtest,$matchArray)){

echo $matchArray[0];

}

//output:中文字符

时间： 2024-12-21 23:49:35

php正则表达式匹配中文的相关文章

php 正则表达式匹配中文规则

utf-8环境下中文的匹配＼w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下匹配中文字符的正则表达式: [＼u4e00-＼u9fa5] 或许你也需要匹配双字节字符,中文也是双字节的字符匹配双字节字符(包括汉字在内):[^＼x00-＼xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 在ANSI(gb2312)环境下匹配全部的gb2312编码表的字符:/[".chr(0xb0)."-".chr(0xf7).

python正则表达式匹配中文详解

如果你需要知道在python中匹配中文汉字的话我们就必须先查看下表 UTF8 [x01-x7f]|[xc0-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3} UTF16 [x00-xd7][xe0-xff]|[xd8-xdf][x00-xff]{2} JIS [x20-x7e]|[x21-x5f]|[x21-x7e]{2} SJIS [x20-x7e]|[xa1-xdf]|([x81-x9f]|[xe0-xef])([x40-x7

正则表达式匹配中文与双字节的代码_正则表达式

匹配中文字符 [\u4e00-\u9fa5] C# 复制代码代码如下: class Class1 { static void Main() { string s = "中文 chinese"; Regex regx = new Regex("[\u4e00-\u9fa5]+"); Match m = regx.Match(s); Console.WriteLine(m.Groups[0].Value); // 中文 Console.ReadKey(); } } 匹

正则表达式匹配中文与双字节的代码

php用正则表达式匹配中文实例详解_php实例

在php中汉字正则可能有些朋友觉得很简单,但是在使用时会发现在gbk编码与uft8编码可能会有点区别哦,下面小编来介绍一下.gbk编码下汉字正则 1.判断字符串是否全是汉字复制代码代码如下: <?php $str = '全部是汉字测试'; if (preg_match_all("/^([x81-xfe][x40-xfe])+$/", $str, $match)) { echo '全部是汉字'; } else { echo '不

php 正则表达式匹配中文汉字

preg_match("/[a-z]{3,14}/",$content,[可选]$a);这个返回布尔值,$a得到的是数组,把匹配到的字符防在$a; 正则汉字 echo (mb_eregi("[x80-xff].","中d文") ? "有" : "无") ."汉字"; echo (mb_eregi("^([x80-xff].)+$","中文") ?

匹配中文字符的正则表达式

原文:匹配中文字符的正则表达式匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白行匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部

php 匹配中文字符的正则表达式

php教程匹配中文字符的正则表达式匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ascii字符计1) */ $str = "singlepoint单点日志"; if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) { print("该

常用正则表达式大全！（例如：匹配中文、匹配html）

一.常见正则表达式匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白行匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复