php使用strlen()判断中文汉字字符串长度

们经常会用到了解字符串长度的时候,在PHP里,可以使用strlen()函数来实现。使用方法如下:

PHP strlen() 函数定义和用法

strlen() 函数返回字符串的长度。

语法

strlen(string)

参数:string
描述:必需。规定要检查的字符串。

实例

 代码如下 复制代码

<?php
echo strlen("Hello world!");
?>

输出:12

那么对于中文怎么处理

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

$

 代码如下 复制代码
enStr = ‘Hello,China!’;
echo strlen($enStr); // 输出:12

而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2,例:

 代码如下 复制代码

$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:12

utf-8编码下每个中文字符所占字节为3,例:

 代码如下 复制代码

$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:18

那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

 代码如下 复制代码

$zhStr = ‘您好,中国!’;
$str = ‘Hello,中国!’;

// 计算中文字符串长度
function utf8_strlen($string = null) {
// 将字符串分解为单元
preg_match_all(“/./us”, $string, $match);
// 返回单元个数
return count($match[0]);
}

echo utf8_strlen($zhStr); // 输出:6
echo utf8_strlen($str); // 输出:9

下面是补充:准确计算字符个数和计算字节数的区别

 代码如下 复制代码
/假设当前页面编码为GBK
<?php
$str="中国abc";
echo strlen($str); //返回7,因为 GBK编码每个中文两个字节,strlen是返回字符串所占的字节长度。
echo "<hr>";
echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是统计字符串的字符数量
?>
或者这么写
<?php
$biaoti="中华人民共和国";
$zijie=strlen($biaoti);
echo $zijie."<br>"; //<br>  换行
?>
//假设当前页面编码为UTF-8
<?php
$str="中国abc";
echo strlen($str); //返回9,因为 UTF-8编码每个中文三个字节,strlen是返回字符串所占的字节长度。
echo "<hr>";
echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是统计字符串的字符数量
?>
iconv_strlen 是无论是何种编码,均能计算准确字符个数。
//假设当前页面编码为GBK
<?php
$str="中国abc";
echo strlen($str); //返回7,因为 GBK编码每个中文两个字节,strlen是返回字符串所占的字节长度。
echo "<hr>";
echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是统计字符串的字符数量
?>
//假设当前页面编码为UTF-8
<?php
$str="中国abc";
echo strlen($str); //返回9,因为 UTF-8编码每个中文三个字节,strlen是返回字符串所占的字节长度。
echo "<hr>";
echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是统计字符串的字符数量
?>

iconv_strlen 是无论是何种编码,均能计算准确字符个数。

时间: 2024-12-04 11:54:06

php使用strlen()判断中文汉字字符串长度的相关文章

sp判断中西混字符串长度

sp判断中西混字符串长度 ==============================  函 数 名:StringLength  作    用:判断字符串长度  参    数:需进行判断的文本Txt  ==============================  Private Function StringLength(Txt)   Txt=Trim(Txt)   x=Len(Txt)   y=0   For ii = 1 To x    If Asc(Mid(Txt,ii,1))<=2 o

php中处理汉字字符串长度:strlen和mb_strlen

本文转自IT摆渡网欢迎转载,请标明出处 更多php文章请阅读 php问题解决 如这个例子: <html> <meta charset="utf-8"> <body> <?php $name="鸣人"; print "姓名的长度为:".strlen($name); ?> </body> </html> 这个代码的输出结果是:姓名的长度为:6 先探讨一下为什么会出现这个问题:PH

计算中文混合字符串长度(二)

计算含中文的混合字符串长度 将字符串转换为 一个中文为 1,一个英文.数字 为 0.5 ,取最大整数长度值,类似腾讯微博计算字数长度方式 function asGbkLength($str, $fromEncode = 'utf-8') { return ceil(strlen(mb_convert_encoding($str, 'gbk', $fromEncode))/2); } $str = 'abcd计算字符串长度12345'; echo $str; echo '<br>'; echo

计算中文混合字符串长度(一)

计算包含中文的混合字符串长度,一个中文.英文.数字 均为 1 function resolveContainCn($string, $charset = 'utf-8') { if ($string == '') { return ''; } if ($charset == 'utf-8') { $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xb

php中文汉字字符串的截取问号

php在操作字符串的问题时间无非两个问题: 1.判断字符串编码是gbk还是unicode. 2.对相应编码采取相应截取方法. 一般情况下我们使用substr截取汉字可能会遇到乱码问题.因为汉字是双字节的,当被截取了一个字节时,这个汉字就无法显示,乱掉了. 其实解决很简单,看下面的截取函数:  代码如下 复制代码 //截取超长字符串 function curtStr($str,$len=30){  if(strlen($str)>$len){   $str = substr($str,0,$len

JavaScript如何判断字符串长度(英文占1个字符,中文汉字占2个字符)

//计算字符串长度(英文占1个字符,中文汉字占2个字符) 方法一: String.prototype.gblen = function() { var len = 0; for (var i=0; i<this.length; i++) { if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) { len += 2; } else { len ++; } } return len; } 方法二: function strlen(str){

C++不使用变量求字符串长度strlen函数的实现方法_C 语言

本文实例讲述了C++不使用变量求字符串长度strlen函数的实现方法.分享给大家供大家参考.具体实现方法如下: 1.strlen的源码实现: size_t strlen(const char *str) //strlen不做内存非法判断,如果是NULL,会core. { const char *eos=str; while(*eos++); return (eos-str-1); } 2.常见面试题会要求不使用额外变量,实现strlen函数: 实现一: int strlen(const char

Java 完美判断中文字符的方法_java

Java判断一个字符串是否有中文一般情况是利用Unicode编码(CJK统一汉字的编码区间:0x4e00–0x9fbb)的正则来做判断,但是其实这个区间来判断中文不是非常精确,因为有些中文的标点符号比如:,.等等是不能识别的. 以下是比较完善的判断方法:CharUtil.java 复制代码 代码如下: import java.util.regex.Pattern; public class CharUtil {     public static void main(String[] args)

JS判断字符串长度(英文占1个字符,中文汉字占2个字符)

//计算字符串长度(英文占1个字符,中文汉字占2个字符) 方法一: String.prototype.gblen = function() { var len = 0; for (var i=0; i<this.length; i++) { if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) { len += 2; } else { len ++; } } return len; } 方法二: function strlen(str){