1、前言
我们经常涉及到数字与字符串之间的转换,例如将32位无符号整数的ip地址转换为点分十进制的ip地址字符串,或者反过来。从给定的字符串中提取相关内容,例如给定一个地址:http://www.bokeyuan.cn:2345,我们要从地址中提出协议,主机地址和端口号。之前对字符串和数字之间的关系不是很熟悉,工作中经常涉及到这个,如是好好总结一下。C语言提供了一些列的格式化输入输出函数,最基本的是面向控制台标准输出和输入的printf和scanf,其实还有面向字符串的sprint和sscanf,面向文件的流的fprintf和fscanf。今天着重总结一下sprintf和sscanf系列函数,这两个函数类似于scanf和printf ,不同点是从字符串*buffer用于输入输出。
2、sprintf函数
sprintf函数原型为 int sprintf(char *str, const char *format, ...)。作用是格式化字符串,具体功能如下所示:
(1)将数字变量转换为字符串。
(2)得到整型变量的16进制和8进制字符串。
(3)连接多个字符串。
举例如下所示:
1 char str[256] = { 0 }; 2 int data = 1024; 3 //将data转换为字符串 4 sprintf(str,"%d",data); 5 //获取data的十六进制 6 sprintf(str,"0x%X",data); 7 //获取data的八进制 8 sprintf(str,"0%o",data); 9 const char *s1 = "Hello"; 10 const char *s2 = "World"; 11 //连接字符串s1和s2 12 sprintf(str,"%s %s",s1,s2);
3、sscanf函数
sscanf函数原型为int sscanf(const char *str, const char *format, ...)。将参数str的字符串根据参数format字符串来转换并格式化数据,转换后的结果存于对应的参数内。具体功能如下:
(1)根据格式从字符串中提取数据。如从字符串中取出整数、浮点数和字符串等。
(2)取指定长度的字符串
(3)取到指定字符为止的字符串
(4)取仅包含指定字符集的字符串
(5)取到指定字符集为止的字符串
sscanf可以支持格式字符%[]:
(1)-: 表示范围,如:%[1-9]表示只读取1-9这几个数字 %[a-z]表示只读取a-z小写字母,类似地 %[A-Z]只读取大写字母
(2)^: 表示不取,如:%[^1]表示读取除'1'以外的所有字符 %[^/]表示除/以外的所有字符
(3),: 范围可以用","相连接 如%[1-9,a-z]表示同时取1-9数字和a-z小写字母
(4)原则:从第一个在指定范围内的数字开始读取,到第一个不在范围内的数字结束%s 可以看成%[] 的一个特例 %[^ ](注意^后面有一个空格!)
解析网址的例子如下所示:
1 const char *s = "http://www.baidu.com:1234"; 2 char protocol[32] = { 0 }; 3 char host[128] = { 0 }; 4 char port[8] = { 0 }; 5 sscanf(s,"%[^:]://%[^:]:%[1-9]",protocol,host,port); 6 7 printf("protocol: %s\n",protocol); 8 printf("host: %s\n",host); 9 printf("port: %s\n",port); 10
4、snprintf函数
snprintf函数是sprintf函数的更加安全版本,考虑到字符串的字节数,防止了字符串溢出。函数形式为:int snprintf(char *restrict buf, size_t n, const char * restrict format, ...);。最多从源串中拷贝n-1个字符到目标串中,然后再在后面加一个0。所以如果目标串的大小为n 的话,将不会溢出。
5、测试程序
本次采用ip地址和整型之间的转换,mac地址转换作为测试程序,整个程序如下所示:
1 #include <stdio.h> 2 #include <assert.h> 3 4 #define IP_STR_LEN 18 5 #define MAC_STR_LEN 18 6 #define MAC_BIT_LEN 6 7 #define LITTLE_ENDIAN 0 8 #define BIG_ENDIAN 1 9 10 typedef unsigned char uchar; 11 typedef unsigned int uint; 12 13 int big_little_endian() 14 { 15 int data = 0x1; 16 if (*((char*)&data) == 0x1) 17 return LITTLE_ENDIAN; 18 return BIG_ENDIAN; 19 } 20 21 uint ipstr2int(const char * ipstr) 22 { 23 assert(ipstr); 24 uint a,b,c,d; 25 uint ip = 0; 26 sscanf(ipstr,"%u.%u.%u.%u",&a,&b,&c,&d); 27 a = (a << 24) ; 28 b = (b << 16) ; 29 c = (c << 8) ; 30 d = (d << 0) ; 31 ip = a | b | c | d; 32 return ip; 33 } 34 35 char *int2ipstr(const uint ip, char *ipstr, const uint ip_str_len) 36 { 37 assert(ipstr); 38 if (big_little_endian() == LITTLE_ENDIAN) 39 sprintf(ipstr,"%u.%u.%u.%u", 40 (uchar)*((char*)(&ip)+3), 41 (uchar)*((char*)(&ip)+2), 42 (uchar)*((char*)(&ip)+1), 43 (uchar)*((char*)(&ip)+0)); 44 else 45 sprintf(ipstr,"%u.%u.%u.%u", 46 (uchar)*((char*)(&ip)+0), 47 (uchar)*((char*)(&ip)+1), 48 (uchar)*((char*)(&ip)+2), 49 (uchar)*((char*)(&ip)+3)); 50 51 return ipstr; 52 } 53 55 char *mac2str(const unsigned char *mac,char *mac_str,const uint mac_str_len) 56 { 57 assert(mac_str); 58 sprintf(mac_str,"%02X-%02X-%02X-%02X-%02X-%02X", 59 mac[0],mac[1],mac[2], 60 mac[3],mac[4],mac[5]); 61 } 62 63 int main() 64 { 65 char ip_str[IP_STR_LEN] = {0}; 66 char mac_str[MAC_STR_LEN] = {0}; 67 unsigned char mac[MAC_BIT_LEN] = {0XEF,0XAD,0XF4,0X4F,0XAA,0X0F}; 68 const char *ipstr = "10.0.3.193"; 69 unsigned int ip; 70 int2ipstr(167773121,ip_str,IP_STR_LEN); 71 mac2str(mac,mac_str,MAC_STR_LEN); 72 ip = ipstr2int(ipstr); 73 printf("%s\n",ip_str); 74 printf("%s\n",mac_str); 75 printf("ip:%u\n",ip); 76 return 0; 77 }
程序执行结果如下所示: