汉字字符的编码为双字节,对于汉字字符和单字节字符混排的情况,如果目标截取的字符串内只包含奇数个单字节字符,则会出现半个汉字字符的问题。如下所示:
(1)天水市秦州区南郭路2号(工行七里墩分理处? --包含数字字符,单字节。
(2)七里河区金港城金福花园20号楼3号(金港城?--包含数字字符,单字节。
(3)甘肃银馨春天餐饮服务业有限责任公司(省委? --包含英文格式半括号。
以上为截取字符串前四位以后的显示结果,其中“?”为半个汉字编码的显示。要想解决以上问题可以采用截取最后一个非法字符,并用合法字符替换的方法。实例代码如下所示:
#include <stdio.h>
int chkHalfChinese(char *buf,int len)
{
int i = 0;
int cnt = 0;
int idx;
for(i=0;i<len;i++)
{
int value = buf[i]&0xFF;
if(value>160)
{
cnt++;
idx=i;
}
}
if(cnt%2)
{
buf[idx] =' ';
return(1);
}
else
{
return(0);
}
}
int main(void)
{
char str[44] = "天水市秦州区南郭路2啊(工行七里墩分理处里家";
if(chkHalfChinese(str,40)==1)
{
printf("true\n");
}
else
{
printf("false\n");
}
printf("%s\n",&str);
return 0;
}
程序代码在Linux环境下测试通过,运行结果如下图所示: