php截取字符串之截取utf8或gbk编码的中英文字符串示例_php实例

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。
php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。
mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。
google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$charset 只支持gbk与utf-8。

复制代码代码如下:

$a = "s＠@你好";
var_dump(strlen_weibo($a,'utf-8'));

结果输出为8，其中字母s计数为1，全角＠计数为2，半角@计数为1，两个中文计数为4。源码如下：

复制代码代码如下:

function strlen_weibo($string, $charset='utf-8')
{
    $n = $count = 0;
    $length = strlen($string);
    if (strtolower($charset) == 'utf-8')
    {
        while ($n < $length)
        {
            $currentByte = ord($string[$n]);
            if ($currentByte == 9 ||
                $currentByte == 10 ||
                (32 <= $currentByte && $currentByte <= 126))
            {
                $n++;
                $count++;
            } elseif (194 <= $currentByte && $currentByte <= 223)
            {
                $n += 2;
                $count += 2;
            } elseif (224 <= $currentByte && $currentByte <= 239)
            {
                $n += 3;
                $count += 2;
            } elseif (240 <= $currentByte && $currentByte <= 247)
            {
                $n += 4;
                $count += 2;
            } elseif (248 <= $currentByte && $currentByte <= 251)
            {
                $n += 5;
                $count += 2;
            } elseif ($currentByte == 252 || $currentByte == 253)
            {
                $n += 6;
                $count += 2;
            } else
            {
                $n++;
                $count++;
            }
            if ($count >= $length)
            {
                break;
            }
        }
        return $count;
    } else
    {
        for ($i = 0; $i < $length; $i++)
        {
            if (ord($string[$i]) > 127)
            {
                $i++;
                $count++;
            }
            $count++;
        }
        return $count;
    }
}

时间： 2024-10-04 07:59:39

php截取字符串之截取utf8或gbk编码的中英文字符串示例_php实例的相关文章

php截取字符串之截取utf8或gbk编码的中英文字符串示例

php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求,下面给大家提供一个方法来完成这样的功能微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个. php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求. mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以. google了下,找到一个discuz中截取各种编码字符的类,改

php中序列化与反序列化在utf8和gbk编码中测试

php 在utf8和gbk编码下使用serialize和unserialize互相序列化和反序列化会出现无法成功反序列化的问题. 问题出现的原因主要是在不同编码下strlen函数计算中文字符串长度不同的原因. 代码如下复制代码 <?php $array=array('title'=>'php教程分享网','url'=>'http://www.111cn.net'); echo serialize($array); //gbk编码 a:2:{s:5:"title"

在php中如何使用json_decode解析gbk编码的json字符串

今天看到csdn的bbs上有人问如何用json_decode解析gbk编码的串. 大家都知道,json都是utf8编码的.json_encode后的字符串都是会变成"\u4fe1\u6d77\u9f99"格式. 如下面的代码: $arr = "信海龙"; echo json_encode($arr); 输出结果为:"\u4fe1\u6d77\u9f99" 如果你有一个符合json格式的gbk编码的字符串,如何使用json_decode进行解析呢?

基于php导出到Excel或CSV的详解(附utf8、gbk 编码转换)

php导入到excel乱码是因为utf8编码在xp系统不支持所有utf8编码转码一下就完美解决了utf-8编码案例Php代码复制代码代码如下: <?php header("Content-Type: application/vnd.ms-excel; charset=UTF-8"); header("Pragma: public"); header("Expires: 0"); header("Cache-Control: m

基于php导出到Excel或CSV的详解(附utf8、gbk 编码转换)_php技巧

php导入到excel乱码是因为utf8编码在xp系统不支持所有utf8编码转码一下就完美解决了utf-8编码案例Php代码复制代码代码如下: <?php header("Content-Type: application/vnd.ms-excel; charset=UTF-8"); header("Pragma: public"); header("Expires: 0"); header("Cache-Control: m

PHP字符串的编码问题的详细介绍_php实例

大家都知道,不同字符编码,其在内存占用的字节数不一样.如ASCII编码字符占用1个字节,UTF-8编码的中文字符是3字节,GBK为2个字节. PHP 也自带几种字符串截取函数,其中常用到的就是 substr 和 mb_substr. 使用substr截取中文字符时会出现乱码,这是因为substr是按字节来截取的.即UTF-8编码的中文,使用substr截取,只会截取1/3个中文,当然出现乱码了. mb_substr ( string $str , int

PHP中字符与字节的区别及字符串与字节转换示例_php实例

字符: 字符是可使用多种不同字符方案或代码页来表示的抽象实体.例如,Unicode UTF-16 编码将字符表示为 16 位整数序列,而 Unicode UTF-8 编码则将相同的字符表示为 8 位字节序列.公共语言运行库使用 Unicode UTF-16(Unicode 转换格式,16 位编码形式)表示字符. php在UTF-8编码下,一个汉字占3个字符,gbk编码下只占2个字符. 字节(Byte): 字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位. 应用: 如果数据库中表为UTF8

php ucwords() 函数将字符串中每个单词的首字符转换为大写(实现代码)_php实例

php ucwords() 函数将字符串中每个单词的首字符转换为大写, 本文章向码农介绍php ucwords() 函数的基本使用方法和实例,感兴趣的码农可以参考一下. 定义和用法 ucwords() 函数把字符串中每个单词的首字符转换为大写. 注释:该函数是二进制安全的. 相关函数: lcfirst() - 把字符串中的首字符转换为小写 strtolower() - 把字符串转换为小写 strtoupper() - 把字符串转换为大写 ucfirst() - 把字符串中的首字符转换为大写语法

PHP 正则判断中文UTF-8或GBK的思路及具体实现_php技巧

UTF-8匹配: 在javascript中,要判断字符串是中文是很简单的.比如: 复制代码代码如下: var str = "php编程"; if (/^[\u4e00-\u9fa5]+$/.test(str)) { alert("该字符串全部是中文"); }else{ alert("该字符串不全部是中文"); } //php中,是用\x表示十六进制数据的.于是,变换成如下的代码: $str = "php编程"; if (pr

猜你喜欢

Win7怎样关闭系统还原？

1.右击计算机,点属性--高级系统选项,去掉在所有驱动器上关闭系统还原前的勾. 2.运行gpedit.msc组策略里,计算机配置--管理模板--windows组件--windowsInstalle ...

DB2 所有数据库表、表字段注释乱码问题的排查及解决方案

问题背景:自2015年以来,国家项目测试平台 DB2 所有表的表名.表字段等中文注释均开始存在乱码问题,严重影响开发人员对于数据库表含义的理解(特别是在数据库设计文档缺乏的情况下). 本文记录了解决该 ...

网站设计技巧:WEBJX收集国外漂亮的contact页面设计

文章描述:在设计网站的时候,我们需要考虑到各个方面,从页眉到脚,从着陆页(landing page)到关于页(about us page),还有联系页面(contact page)都要考虑.联系页面是 ...

session_unset() 释放当前在内存中已经创建的所有$_SESSION变量,但不删除session文件以及不释放对应的session id session_destroy() 删除当前用户对 ...

在虚拟机上安装SQL 2005 没有服务器名称

今天在虚拟机上做实验,安装SQL 05 没有服务器名称在摆渡和谷哥两位大神的帮助下,找到解决方法必须安装一个SQL补丁才行,前提是安装Microsoft .NET Framework 2.0 和M ...

Domino下批量删除邮箱用户个人配置文档及数据库文件

近期一直在看Domino相关的文章,加上公司也用的是Domino系统,然后加上公司的用户数据量比较庞大,而且人员流动比较大,每日入职删除的人员比较多,这样给管理员的工作添加了很大的负担,那有什么好的办 ...

JAVA提高教程(10)-认识List列表之Stack

不多说,我们直接看源代码 1.package collection.lession10; 2. 3.import java.util.Arrays; 4.import java.util.List; ...

PS怎么制作水滴俏皮文字

PS怎么制作水滴俏皮文字完成效果一,选取"文件/创建"菜单,打开"创建"或Ctrl+N对话框名称为:液体字体做,宽度:为800像素, ...

windows 8如何安装，win8安装教程

随着windows8已经定型,目前我们可以下载到的是windows 8免费消费者预览版.不过在后期正式版本的windows8系统也与消费者预览版大同小异,下面本文将教大家如何安装windows8系统. ...

javascript检测页面是否缩放

/* * zoomCheck */ jQuery(function($){ var dCheck = $("#zoomCheck"); if(dCheck.size() != 0 ...

2个路由器如何设置才能同时上网的方法分享

第一种方法: 从原来的路由器上的Lan口接一股线到新买路由器的Lan口,ip什么的跟原来的电脑一样的设置.很简单,就是将路由器变成了交换机使用,多浪费了一个口,要不能多接台机器.懒人必备. 第二种方法 ...

PPT的排版技巧突出中心

一.在具有一定配置的场景内,有些对象突现出来是图形及背景,一般说来,图形和背景的区分度很大,图形就越可突出而成为我们的知觉对象. 二.对比与相似:根据想要表达的终重点控制图片好文字和图片,主干和非 ...

win8/8.1安装如何win10双系统

1.为Win10创建一个新的安装分区; 2.首先我们需要为接下来的Win10预览版安装准备一个纯净的磁盘分区,这里笔者教大家如何直接在Win8/8.1系统中,创建一个新的分区; 3.首先进入Win ...

jdk-win8.1无法打开JDK安装包

问题描述 win8.1无法打开JDK安装包想安装JDK,但是总是提示这个对话框,求助!! 解决方案 WIN8.1 JDK的安装与配置解决方案二: 我的系统就是 Win8.1.安装JDK没有问题,所 ...

在ubuntu终端遇到的问题

问题描述在ubuntu终端遇到的问题 ubuntu终端,sudo:gnome-open/home:command not found 解决方案 sudo gnome-open /home 然后输入密 ...

马云阿根廷讲跨境贸易：没有什么是事前准备好的

除了电子商务,双H(幸福与健康)也是未来发展方向,阿根廷拥有优美的环境和举世闻名的足球运动,这个国家未来充满机遇. 阿根廷当地时间5月2日下午,阿里巴巴集团董事局主席马云在造访总统府后,参加了一场由阿 ...

RCF:一个相当不错的C++分布式RPC框架

RCF(远程调用框架)是一个可以移植的C++进程间通信框架,使用C++语言特性,提供了一个简单高效的编写分布式C++软件的途径.RCF利用编译时多态清晰分开了接口和实现. 和传统的RPC框架如CORB ...

WinCE USB驱动开发经验谈

WinCE USB驱动开发经验谈随着USB2.0设备的不断增加,USB设备驱动开发在嵌入式开发中变的越来越重要.Windows CE支持USB 2.0更是对这一波新技术浪潮产生巨大的推动.近期我负责 ...

求助，调用company.dll 文件时出错了，多谢各位帮忙！

问题描述 ServerErrorin'/'Application.------------------------------------------------------------------- ...

java中举个实现抽象类抽象方法的例子瞧瞧，谢谢

问题描述 java中举个实现抽象类抽象方法的例子瞧瞧,谢谢 java中举个实现抽象类抽象方法的例子瞧瞧, 谢谢我知道抽象类既可以有抽象方法也可以有非抽象方法的解决方案大致是这样子的,抽象类Cla ...

Spring定时器异常

问题描述 applicationContext.xml:<beanid="SpideTimeTask"class="timeTask.SpideTimeTask&q ...

MySQL内核月报 2015.02-TokuDB · 特性分析· 日志详解

TokuDB的日志跟InnoDB不一样,它有两类文件: redo-log文件(以.tokulog[序号]为扩展名) rollback日志文件(tokudb.rollback) 接下来就简单唠唠这两类文 ...

java-1Java的问题多个类怎么写代码呢。

问题描述 1Java的问题多个类怎么写代码呢. 就是在eclipse中写建立一个Java工程,有两个类,把代码打进去了,为啥运行不了呢,要分别建立类吗,分别建立的类就是打与其相关的额那一部分就可以了吗 ...

Win2008下搭建php开发环境(IIS FastCGI版)_win服务器

注意所用到软件的版本,不同的版本会有不少差别,有可能最后会搭建不成功,而且各位童鞋也不用担心小狼所用版本会不会太老,因为这里所用的软件不是比较新的就是比较稳定的版本,完全可以满足大家的需要了,那就先看 ...

中移动6月新增用户创16个月新低

昨日,三大运营商纷纷发布6月数据.数据显示,中国移动6月新增用户501.9万至4.93亿户,6月新增3G用户21.3万至95.9万:中国电信6月CDMA用户新增237万户至3928万户,6月新增用户数 ...

魅族MX/M9 2.3.5测试固件V2.0.6-12031

魅族工程师成成在论坛临时发布的测试固件.成成原话:"拍照依然没解决非常好,其它严重问题基本解决.感觉依然没有完全达到预期,不过不想让大家再煎熬了,先放出来吧." 注意事项: MX和 ...

在访问google latitude api时需要oauth认证，google oauth认证如何申请呢，请各位大哥指点一下，多谢。

问题描述在申请googleaouth是否还需要自己拥有域名才可以申请呢,https://www.google.com/accounts/ManageDomains这个页面就是要填写域名的页面,反正申 ...

javascript 使用DOM控制表格及表单实例教程

使用DOM控制表格表格常用的DOM 表格添加操作的方法常用的为insertRow()和insertCell()方法. row是从零开始计算起的,例如: var oTr = document.getE ...

plx9030触发pci中断

if(((SWAB_16(PLX_INT(0x4C)))&0x04)==0x04) { ErrNo = *(UINT16*)(g_MemBase+0XFFFE*2); /*logMsg(&qu ...

是什么让黑客盯上了医院

美国大力推进电子病历记录项目,医疗系统的病历档案全部联网,这为黑客们向医院下手提供了便利.大量的患者信息被窃取,个人利益严重受损.这也在提醒管理者:如何平衡医学创新和监管之间的关系,已经成为一个不可忽 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.019 s.