什么是GBK编码和UTF-8编码?UTF-8版本跟GBK版本有何不同

   常见建站程序的GBK版本与UTF-8版本功能是一样的.只不过编码方式不同。

  GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

  至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的网站则用UTF-8节省空间。

  GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

  GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准,UTF-8编码的文字可以在各国各种支持UTF-8字符集的浏览器上显示。

  比如,如果是UTF-8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

  提示:如果网站主要是面向国内用户的,建议使用GBK版本,因为它可以节省空间。

时间: 2024-09-17 04:02:21

什么是GBK编码和UTF-8编码?UTF-8版本跟GBK版本有何不同的相关文章

告别乱码,针对GBK、UTF-8两种编码的智能URL解码器的java实现(转)

效果图     字符 字符是早于计算机而存在,从人类有文明那时起,人们就用一个个符号代表世间万象.如ABC,如"一.二.三". 字符集 字符集是所有字符的集合.   XXX字符集 给字符集中的每一个字符套上一个序号后的字符集.常见的XXX字符集有ASCLL字符集.Unicode字符集等等,不同种字符集为每个字符编的序号不同,包含的字符数量也不同. GBK.UTF-8 GBK.UTF-8是一种编码编码格式.当然,你也可以说unicode是一种编码格式,因为它的的确确为每个字符编了一个码,

字符编码掠影:现代编码模型

Abstract 字符编码,在计算机导论中经常作为开门的前几个话题来讲,然而很多CS教材对这个话题基本都是走马观花地几页带过.导致了许多人对如此重要且基本的概念认识模糊不清.直到在实际编程中,尤其是遇到多语言.国际化的问题,被虐的死去活来之后才痛下决心去重新钻研.诸如此类极其基础却又容易被人忽视的的知识点还有:大小端表示,浮点数细节,正则表达式,日期时间处理等.本文是系列的第一篇,旨在阐明字符编码这个大坑中许多纠缠不清的概念. 基本概念 现代编码模型自底向上分为五个层次: 抽象字符表 ACR (

Url的编码与String的编码 . 下面的代码是怎么回事?

问题描述 public class UrlTest {public static void main(String[] args) throws Exception {String s = "中文"; //1. 这里是GBK编码String s1 = URLEncoder.encode(s, "iso8859-1"); //2. 这里再用iso8859-1编码了一回System.out.println(s1);byte[] b = s1.getBytes("

php自动识别文字编码并转换为目标编码的方法_php技巧

本文实例讲述了php自动识别文字编码并转换为目标编码的方法.分享给大家供大家参考.具体如下: 在PHP处理页面的时候,我们对于字符集的转换都是采用了iconv或者mb_convert等函数,但,这其实是有一个前提的.即我们事先得知道in和out是什么样的编码,我们才能进行正确的转换. 虽然大多数转换都是在gbk和utf-8之间转,但如果不知道转换对象的编码怎么办呢?谷歌出来这么一个函数safeEncoding,可以简单的识别UTF8和GBK的编码.这个函数在一定程度上识别的很准确,但是在一些比较

x264代码剖析(十六):核心算法之宏块编码中的量化编码

x264代码剖析(十六):核心算法之宏块编码中的量化编码           为了进一步节省图像的传输码率,需要对图像进行压缩,通常采用变换编码及量化来消除图像中的相关性以减少图像编码的动态范围.本文主要介绍量化的相关内容,并给出x264中量化编码的代码分析.   1.量化编码           量化过程就是根据图像的动态范围大小确定量化参数,既保留图像必要的细节,又可以减少码流.在图像编码中,变换编码和量化从原理上讲是两个独立的过程.但在H.264中,将两个过程中的乘法合二为一,并进一步采用

vs13版本和10版本window窗体设计编码变了好多,用起来完全不适应。

问题描述 vs13版本和10版本window窗体设计编码变了好多,用起来完全不适应. . 10版用的代码放进去都不行. 弄个模式对话框10版用的代码 Form2 form =new Form2(); form.TopMost=ture; form.showdialog(); 到13版 代码打进去 form就出问题了..新手完全不会用.求解释.. 下10版又说有个pack1未更新 . 更新读条完全不动.. 解决方案 如果你说的是C++或许有些变化. 但是就C#来说,新的VS没有什么变化. 至于你说

你不知道的 页面编码,浏览器选择编码,get,post各种乱码由来

原文:你不知道的 页面编码,浏览器选择编码,get,post各种乱码由来 asp.net页面编码和浏览器的选择编码 每个asp.net的朋友都知道,在新版本的visual studio,在没有任何设置的情况下,新建页面时的默认编码为utf-8 我们可以从两个地方可以看出: 第一:打开aspx页面,"文件"->"高级保存选项",如下图,可以看出编码为:Unicode(UTF-8带签名) 第二:找到aspx存放路径,用系统自带的文本编辑器打开,然后"文件

生成编码-C#生成ID编码的方法 在线等 请指教 谢谢

问题描述 C#生成ID编码的方法 在线等 请指教 谢谢 后台生成, 辖区编码+4位顺序号 辖区编码可获得 然后4位顺序编码,怎么才能在后台实现呢,最好能从0000开始 1000开始也行 数据库存储过程 以及语句不熟悉 尽量后台 方法实现! 谢谢 在线等..... 解决方案 http://bbs.csdn.net/topics/390428913 解决方案二: string code=""我是辖区编码""; Enumerable.Range(1000100).Sele

hevc-HEVC编码优化关于CU编码单元的优化

问题描述 HEVC编码优化关于CU编码单元的优化 谁有HEVC编码中关于CU编码单元优化的程序,传一份,赶紧不紧.(邮箱:251085412@qq.com) 解决方案 你要哪部分代码?什么算法代码?