php的汉字转换: Unicode(UTF8)->GBK

汉字|转换

秋水无恨 GBK Unicode UTF8 汉字 转换

php的汉字转换一直是比较麻烦的事

该类内置了四个过滤"[dec];","[hex];","%u[hex]","utf8转换"
方便用户的使用,同时也可自定义过滤进行自己喜欢的操作

qswhU.php 从这里下载
http://www.blueidea.com/user/qswh/qswhU.zip

class qswhU{
 var $qswhData;
 function qswhU($filename="qswhU.php"){
  $this->qswhData=file($filename);
 }
 
 function decode($str,$pattern=0){
  $arr=array("/(\w+);/iU","/((%\w\w)+)/i","/%u(\w{4,5})/iU");
  if(is_integer($pattern)){
    if($pattern>=count($arr))die("Invalid Function");
    $pattern=$arr[$pattern];
  }
  return preg_replace_callback($pattern,array($this,"u2gb"),$str);
 }
 
 function u2gb($arr){
  /******(qiushuiwuhen 2002-8-15)******/
  $ret="";$str=$arr[1];
  if(preg_match_all("/%\w{2}/",$str,$matches)){
   for($i=0;$i<count($matches[0]);$i++){
    $chr1=hexdec(substr($matches[0][$i],1));
    $arr=array("f0","e0","c0","0");
    for($j=0;$j<count($arr);$j++)if($chr1>hexdec($arr[$j]))break;
    $chr=hexdec(substr($matches[0][$i],1))-hexdec($arr[$j]);
    while(++$j<count($arr))$chr=$chr*0x40+(hexdec(substr($matches[0][++$i],1))-0x80);
    $str=dechex($chr);
    if(strlen($str)==4){
     $p=hexdec(substr($str,0,2))-0x4d;
     $q=hexdec(substr($str,2))*4;
     $ret.=chr(hexdec(substr($this->qswhData[$p],$q,2)));
     $ret.=chr(hexdec(substr($this->qswhData[$p],$q+2,2)));
    }else
     $ret.=chr(hexdec($str));
   }
  }
  else{
   if(strtolower($str[0])=="x")
    $str=substr($str,1);
   else
    if(strlen($str)!=4)$str=dechex($str);
   
   if(strlen($str)==4){
    $p=hexdec(substr($str,0,2))-0x4d;
    $q=hexdec(substr($str,2))*4;
    $ret.=chr(hexdec(substr($this->qswhData[$p],$q,2)));
    $ret.=chr(hexdec(substr($this->qswhData[$p],$q+2,2)));
   }else
    $ret.=chr(hexdec($str));
  }
  return $ret;
 }
 
 
}

使用范例

$qswh=new qswhU("qswhU.php");//如果文件名是qswhU.php,可省参数
echo "<xmp>不带参数(默认过滤为:[num];):";
echo "\n".$qswh->decode("中文Abc");
echo "\n".$qswh->decode("中文Abc");
echo "\n调用内置过滤(UTF转码):".$qswh->decode("%E4%B8%AD%E6%96%87%20!%22%23%24%25%26'()*%2B%2C%2F%3A%3B%3C%3D%3E%3F%40%5B%5D%5E%60%7B%7C%7D~%25Abc",1);
echo "\n调用内置过滤unescape(%u[num]):".$qswh->decode("%u4E2D%u6587Abc",2);
echo "\n自定义过滤([x+num]):".$qswh->decode("[x4E2D][x6587][x41][x62][x63]","/\[(\w+)\]/");

效果如下:
不带参数(默认过滤为:[num];):
中文Abc
中文Abc
调用内置过滤(UTF转码):中文 !"#$%&'()*+,/:;<=>?@[]^`{|}~%Abc
调用内置过滤unescape(%u[num]):中文Abc
自定义过滤([x+num]):中文Abc

 

时间: 2024-12-02 22:18:40

php的汉字转换: Unicode(UTF8)-&gt;GBK的相关文章

php从Unicode(UTF8)-&amp;gt;GBK的汉字转换

php的汉字转换一直是比较麻烦的事 该类内置了四个过滤"&#[dec];","&#x[hex];","%u[hex]","utf8转换" 方便用户的使用,同时也可自定义过滤进行自己喜欢的操作 qswhU.php 从这里下载 http://www.blueidea.com/user/qswh/qswhU.zip class qswhU{ var $qswhData; function qswhU($filenam

C++转换unicode utf-8 gb2312编码

windows开发环境下用VC++6.0 对unicode .utf-8. gb2312 三种编码格式之间的转换方法:   [cpp] view plaincopy   #include <iostream>   #include <string>   #include <Windows.h>   using namespace std;      void unicodeToUTF8(const wstring &src, string& result

偶数汉字转utf-8-VB将汉字字符串转换成 UTF-8格式

问题描述 VB将汉字字符串转换成 UTF-8格式 VB将汉字字符串转换成 UTF-8格式后按照JSON格式提交给服务器,偶数个汉字没有问题,但奇数个汉字时,会有问题,请大师指导. Private Declare Function MultiByteToWideChar Lib "kernel32 " (ByVal CodePage As Long, ByVal dwFlags As Long, ByVal lpMultiByteStr As Long, ByVal cchMultiBy

php的汉字转换:GBK至Unicode(UTF8)

php的汉字转换一直是比较麻烦的事 该类内置了四个函数"htmlHex","htmlDec","escape","u2utf8" 方便用户的使用,同时也可自定义函数进行自己喜欢的操作 qswhGBK.php 从这里下载 /user/qswh/qswhGBK.zip

php的汉字转换: GBK-&amp;gt;Unicode(UTF8)

汉字|转换 php的汉字转换一直是比较麻烦的事 该类内置了四个函数"htmlHex","htmlDec","escape","u2utf8"方便用户的使用,同时也可自定义函数进行自己喜欢的操作 qswhGBK.php 从这里下载http://www.blueidea.com/user/qswh/qswhGBK.zip <?class qswhGBK{ var $qswhData; function qswhGBK($fi

unicode编码转换:PHP将汉字转换成Unicode编码的函数

这是一个将汉字转换成Unicode编码的PHP函数,支持GBK和UTF8编码.function uni_decode ($uncode){$word = json_decode(preg_replace_callback('/(\d{5});/', create_function('$dec', 'return \'\\u\'.dechex($dec[1]);'), '"'.$uncode.'"'));return $word;}对 Unicode 转换为汉字function uni_

汉字转换成Unicode编码PHP程序

汉字转换成unicode方法  代码如下 复制代码 <?php //将utf8编码的汉字转换为unicode function htou($c){  $n = (ord($c[0]) & 0x1f) << 12;  $n = (ord($c[1]) & 0x3f) << 6;  $n = ord($c[2]) & 0x3f;  return $n; } //在代码中隐藏utf8格式的字符串 function my_utf8_unicode($str)

ASP写的汉字转换UTF-8及UTF-8转GB2312

汉字|转换 汉字转换为UTF-8 function chinese2unicode(Str)   dim i   dim Str_one   dim Str_unicode   for i=1 to len(Str)     Str_one=Mid(Str,i,1)     Str_unicode=Str_unicode&chr(38)     Str_unicode=Str_unicode&chr(35)     Str_unicode=Str_unicode&chr(120)

ASP汉字转换UTF-8及UTF-8转换GB2312

汉字|转换 汉字转换为UTF-8 function chinese2unicode(Str)   dim i   dim Str_one   dim Str_unicode   for i=1 to len(Str)     Str_one=Mid(Str,i,1)     Str_unicode=Str_unicode&chr(38)     Str_unicode=Str_unicode&chr(35)     Str_unicode=Str_unicode&chr(120)