utf8

当前，utf8_unicode_ci校对规则仅部分支持Unicode校对规则算法。一些字符还是不能支持。并且，不能完全支持组合的记号。这主要影响越南和俄罗斯的一些少数民族语言，如：Udmurt 、Tatar、Bashkir和Mari。

utf8_unicode_ci的最主要的特色是支持扩展，即当把一个字母看作与其它字母组合相等时。例如，在德语和一些其它语言中‘ß’等于‘ss’。

utf8_general_ci是一个遗留的校对规则，不支持扩展。它仅能够在字符之间进行逐个比较。这意味着utf8_general_ci校对规则进行的比较速度很快，但是与使用utf8_unicode_ci的校对规则相比，比较正确性较差）。

例如，使用utf8_general_ci和utf8_unicode_ci两种校对规则下面的比较相等：

Ä = A

Ö = O

Ü = U

两种校对规则之间的区别是，对于utf8_general_ci下面的等式成立：

ß = s

但是，对于utf8_unicode_ci下面等式成立：

ß = ss

对于一种语言仅当使用utf8_unicode_ci排序做的不好时，才执行与具体语言相关的utf8字符集校对规则。例如，对于德语和法语，utf8_unicode_ci工作的很好，因此不再需要为这两种语言创建特殊的utf8校对规则。

utf8_general_ci也适用与德语和法语，除了‘ß’等于‘s’，而不是‘ss’之外。如果你的应用能够接受这些，那么应该使用utf8_general_ci，因为它速度快。否则，使用utf8_unicode_ci，因为它比较准确。

时间： 2024-12-26 20:09:22

utf8的相关文章

移除UTF-8文件头的BOM

inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish ).(来源:http://blog.csdn.net/inkfish) UTF-8 BOM又叫UTF-8 签名,在UTF-8文件的头部,长度为3个字节.其实UTF-8 的BOM对UFT-8没有作用,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别.但是在Eclipse中,带有BOM的java源码生成javadoc时却会出现如下错误:(来源:http://blog.cs

utf 8-关于UTF-8中的汉字读取

问题描述关于UTF-8中的汉字读取想读取一个有中英混编UTF-8文件中的汉字内容.应该怎么读取啊.汉字只有0xE4XXXX到0xE9XXXX么? 解决方案这篇文章应该有帮助字符编码笔记:ASCII,Unicode和UTF-8 然后看这个是范围: UTF-8 编码规则详解与 UTF-8 汉字编码范围解决方案二: 正则来读取,一般就是在[u4e00-u9fa5]这个范围内的多

解决IIS下UTF-8文件报错乱码问题

解决IIS下UTF-8文件报错乱码的问题原因: 你的网站是utf-8编码,但iis的错误信息输出默认使用的是gb2312编码.导致iis出现运行时错误的时候显示的页面是乱码. 解决办法: [办法1] 自己处理错误,不让iis来处理. 在所有可能出错的地方,都用类似下面的方式来捕捉. On Error Resume Next Err.Raise 6 '这行是可能出错的代码 If Err Then Response.Write Err.Description Response.End End If

在cmd窗口中显示UTF-8字符

有这么一个文件,它在Eclipse属性中看到是UTF8编码的,里面包含了中文: 但是当在Windows控制台中查看这个文件(为了方便,我将文件拷贝到桌面了)的时候,就是乱码了: 那如何让cmd可以显示这些UTF8编码的字符呢?这里需要先了解些相关内容: chcp命令 chcp是MS DOS中的命令,用来显示或设置活动代码页编号的.用法是: ? 1 2 3 4 5 6 7 8 C:\Users\002778\Desktop>chcp /? 显示或设置活动代码页编号. CHCP [nnn]

MySQL中UTF8编码的数据在cmd下乱码

花了一下午,解决MySQL在Windows的cmd下中文乱码的问题. ? 1 2 3 4 5 6 7 8 9 10 11 12 13 mysql> use abc; Database changed mysql> select * from school; +----------+--------------------+-------------------------------------------+ | schoolid | name | address

关于在UNICODE CString转UTF-8

问题描述关于在UNICODE CString转UTF-8 如何Unicode下,将CString转成UTF-8.例如:CString xx=""您好""CSting str=URLEnCode(xx);转换后的结果:str的内容就是%e6%82 解决方案 CString str(_T(""我是中国人"")); CT2A szUtf8(strCP_UTF8); string s_utf8(szUtf8); CString st

mysql的默认码子怎样改成UTF-8的码子？

问题描述 mysql的默认码子怎样改成UTF-8的码子? 我的mysql数据库中的默认码子是英文的怎样改成utf-8的码子? 解决方案 Windows系统 1.中止MySQL服务 2.在MySQL的安装目录下找到my.ini,如果没有就把my-medium.ini复制为一个my.ini即可 3.打开my.ini以后,在[client]和[mysqld]下面均加上default-character-set=utf8,保存并关闭 4.启动MySQL服务运行下面两条命令查看修改的结果: 1.运行命令

mac下修改mysql默认字符集为utf8

1.首先检查默认安装的字符集 [html] view plain copy print? mysql> show variables like '%char%'; +--------------------------+--------------------------------------------------------+ | Variable_name | Value

UTF-8编码的网页如何自定义表单提交给百度搜索

有时,为了方便访问者直接在自己的网站调用百度的搜索功能,自己就自定义的写了一个表单来提交到百度的网址,代码如下: <form action="http://www.baidu.com/s" id="fbd" target="_blank"> <p class="tt">百度优化搜索</p> <p class="input"><input type=&

ASP 系统中输出 UTF-8 内容（XML）的方法

ASP 做的系统默认是 GB2312 的,有时候用来输出 XML 会遇到一个问题:就是大多数情况下要求 XML 为 UTF-8 格式的. 如果我们直接指定 <?xml version="1.0" encoding="utf-8"?> 是不够的. 正确的应该是: <%dim originalCoagePageoriginalCoagePage = Session.CodePage ' 记住原来的 CodePage(默认为 936)Session.Co

猜你喜欢

MathType工作区域背景颜色怎么修改

具体操作过程如下: 1.打开MathType公式编辑器软件进入到编辑状态,不管你是从Word中插入打开还是双击桌面上的MathType应用图标都没有影响.这里可以看到编辑区的背景是白色的,这也是M ...

图形化编程实现改进的欧拉格式和龙格库塔格式。这里有个C语言的，想改写成C#。

问题描述图形化编程实现改进的欧拉格式和龙格库塔格式.这里有个C语言的,想改写成C#. 1)改进欧拉法求解常微分方程的初值问题 #include float func(float x,float y) ...

FreeBSD下构建安全的Web服务器(1)

序言在我们跑Web服务器的时候,大家可能都会一致认为使用Linux+Mysql+Apache+PHP整个开源的系统是比较好的选择,但是我个人认为这是不合理的,首先要根据你的应用来觉得你使用什么服务. ...

什么是JavaScript框架

摘要:现代网站和web应用程序趋向于依赖客户端的大量的javascript来提供丰富的交互.特别是通过不刷新页面的异步请求来返回数据或从服务器端的脚本(或数据系统)中得到响应.在这篇文章中,你将会了解 ...

怎么决定网站选什么关键词

一个网站在建立初期,必须考虑一个问题:怎么决定网站选什么关键词,对于一个新的网站,获取流量的入口主要是搜索引擎,而关键词选择的正确与否,却是网站是否能获得流量的重要性因素.因此在选择网站关键词的时候, ...

在指定应用程序域中执行代码

程序|执行超级入门级:) 哈哈~ 留个纪念.//// 在指定应用程序域中执行代码////// using System;using System.Collections.Generic;using ...

站内搜索脚本例子二(&#106avascript)

脚本脚本说明:把如下代码加入<body>区域中<script language="javascript"> var key = ""; ...

我加一点，转自msdn

Variable Description ALL_HTTP All HTTP headers sent by the client. ALL_RAW Retrieves all headers in ...

在Linux系统上部署Apache+Python+Django+MySQL环境

Linux+apache+mysql+python+mod_python+Django 说明:系统rhel 5.3,默认安装httpd.mysql,没有安装的,请下载安装RPM包,删除/etc/h ...

PHP数组相关函数汇总

这篇文章主要介绍了PHP数组相关函数,汇总说明了php中相关的数组,具有一定参考借鉴价值,需要的朋友可以参考下本文总结了PHP数组相关的函数.分享给大家供大家参考.具体如下: 这里包括函数 ...

360浏览器闪烁怎么解决

方法一:第一步:打开360软件管家,然后搜索"Flash插件修复工具",下载下来第二步:安装,安装以后点击"立即修复",这个时候如果你打开了360浏览器, ...

Word2010如何插入复选框

在日常使用word过程中,常常需要制作一些信息表,有些字段需要进行选择,如性别中的男,女;在做问题调查问卷时,复选框用到的就比较多了,那在word2010中如何插入复选框呢? 步骤 1.打开需要插 ...

wifi密码怎么设置才不会被破解

wifi密码怎么设置才不会被破解?在这个网络发达的时代,基本上每家每户都会装wifi网络,但是不管怎么设置密码,都会被蹭网.下文小乐哥给大家分享wifi密码防破解教程,一起来看看吧! 防蹭网要素第 ...

XP系统70个小技巧

尽管win10正式版即将发布,微软也早已放弃了XP,但作为曾经最成功的操作系统,依然是拥有众多的用户的,并且下面很多XP技巧,在Win10系统中,同样可以使用,所以小编在此再次整理了相关技巧. 1 ...

第十三章事务并发处理

Hibernate是JDBC的轻量级封装,本身并不具备事务管理能力,在事务管理层,Hibernate将其委托给底层的JDBC或者JTA,以实现事务的管理和调度. H ...

Laravel框架路由配置总结、设置技巧大全_php实例

基本路由您的应用程序的绝大多数路由将在 app/routes.php 文件中定义.Laravel 中最简单的路由由一个 URI 和一个闭包调用组成. 基本 GET 路由复制代码代码如下: Rou ...

炎黄播放器v1.0发布,免费观看上万部高清DVD电影

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 炎黄播放器v1.0是一款功能强大的播放软件,可 ...

webim 怎么实现重发消息

问题描述 else里面的我可以增加,但是:this.context.stropheConn.send(dom); 中如果报错了,会触发onerror事件,这个事件是在哪里订阅的? 解决方案重发消息功 ...

c语言-关关关于C语言基础问题

问题描述关关关于C语言基础问题浮点数是指什么,不包括整数对吗,是指小数吗,小数点可移动的小数?指数吗,劳烦举例解决方案我们有两种方式表示小数,一种是浮点一种是定点. 定点最简单,只要约定好小数 ...

内存＋时间-关于ｆｏｒ和ｆｏｒｅａｃｈ问题

问题描述关于for和foreach问题 java中for和foreach那个循环更快?那个更占内存? 解决方案使用foreach操作集合时,如果集合只有一条数据,删除以后就会报错. ??????? ...

java-关于GC日志打印，求高人解析

问题描述关于GC日志打印,求高人解析最近项目经常不正常的内存溢出,后面尝试打印了下GC日志 [CMS-concurrent-preclean: 0.348/0.351 secs] [Times: ...

【转】 Scrum 过程实践小记

严格来说,不能算是真正的scrum实践,但实践敏捷的过程本身也是一种"敏捷方法",所以就算是"敏捷实践之敏捷开发方法-scrum过程"吧. 一.理论参考:Scr ...

白板上各式各样的箭头图表以及“产品-市场契合度”等一些抽象的概念

但是实际上,评价一款产品就是要说明白为什么有些产品的用户体验人们喜欢而另一些人们不愿买单. 产品设计不是一项天生的技能,需要设计者形成对产品良好的直觉,即对于用户喜欢什么样的功能,什么样的产品会成功有 ...

Python原始字符串(raw strings)用法实例_python

本文实例讲述了Python原始字符串(raw strings)用法,分享给大家供大家参考.具体如下: Python原始字符串的产生正是由于有正则表达式的存在.原因是ASCII 字符和正则表达式特殊 ...

在运行程序是出现Unhandled exception at 0x00194B81 in LDPC_main.exe。。。的错诶

问题描述一个对于LDPC码子译码的程序,在运行时出现了Unhandledexceptionat0x00194B81inLDPC_main.exe:0xC0000005:Accessviolation ...

【全自动机器学习】ML 工程师屠龙利器，一键接收训练好的模型

某日出差,在出租上闲来无事和司机闲聊,告知其本人专业是人工智能,司机师傅顿时打开了话匣子:人工智能我知道,那个 AlphaGo 下围棋没有人能下得过它,吧啦吧啦吧啦......某次乘地铁,听见地铁上三 ...

使用阿里云接口进行银行卡四要素实名认证

如今随着互联网产业的多元化发展,尤其是互联网金融,O2O,共享经济等新兴商业形式的兴起,企业对实名认证业务的数据形式和数据质量有了更高的需求.如今也衍生出银行卡实名认证业务,通过接口将银行卡号.手机号 ...

微软试图让Win32开发者能够更轻松地得到桌面桥（Desktop Bridge）

微软正在采取方法让更多的Win32和.NET开发者能够将他们的应用程序带到Windows 10应用程序商店之中. 微软试图让Win32开发者能够更轻松地得到桌面桥在9月14日,微软宣布它将在Wind ...

jQeury淡入淡出需要注意的问题_jquery

前两天看到橡树小屋朋友发表的<JQuery 实现图片轮播效果>,比较有趣,发现他是使用fadeIn和fadeOut实现图片淡入淡出轮换的.当时曾担心他的例子中如果连续多次点击,所产生的动画 ...

简单漂亮的js弹窗可自由拖拽且兼容大部分浏览器_javascript技巧

简单漂亮的js弹窗 - 自由拖拽复制代码代码如下: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN&qu ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.021 s.