大端和小端(Big endian and Little endian)

一、大端和小端的问题

对于整型、长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节);而 Little endian 则相反,它认为第一个字节是最低位字节(按照从低地址到高地址的顺序存放据的低位字节到高位字节)。

例如,假设从内存地址 0x0000 开始有以下数据:  
0x0000         0x0001       0x0002       0x0003  
0x12            0x34           0xab           0xcd 
如果我们去读取一个地址为 0x0000 的四个字节变量,若字节序为big-endian,则读出结果为0x1234abcd;若字节序为little-endian,则读出结果为0xcdab3412。

如果我们将0x1234abcd 写入到以 0x0000 开始的内存中,则Little endian 和 Big endian 模式的存放结果如下:  
地址           0x0000         0x0001        0x0002          0x0003 
big-endian   0x12           0x34            0xab            0xcd  
little-endian  0xcd           0xab            0x34            0x12

一般来说,x86 系列 CPU 都是 little-endian 的字节序,PowerPC 通常是 big-endian,网络字节顺序也是 big-endian还有的CPU 能通过跳线来设置 CPU 工作于 Little endian 还是 Big endian 模式。

对于0x12345678的存储:

小端模式:(从低字节到高字节)
地位地址 0x78 0x56 0x34 0x12 高位地址

大端模式:(从高字节到低字节)
地位地址 0x12 0x34 0x56 0x78 高位地址

二、大端小端转换方法

htonl() htons() 从主机字节顺序转换成网络字节顺序
ntohl() ntohs() 从网络字节顺序转换为主机字节顺序

Big-Endian转换成Little-Endian

#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) | (((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) | (((uint32)(A) & 0x00ff0000) >> 8) | \
             (((uint32)(A) & 0x0000ff00) << 8) | (((uint32)(A) & 0x000000ff) << 24))

三、大端小端检测方法

如何检查处理器是big-endian还是little-endian?

C程序:

    int i = 1;
    char *p = (char *)&i;
    if(*p == 1)
          printf("Little Endian");
    else
          printf("Big Endian");

    大小端存储问题,如果小端方式中(i占至少两个字节的长度)则i所分配的内存最小地址那个字节中就存着1,其他字节是0.大端的话则1在i的最高地址字节处存放,char是一个字节,所以强制将char型量p指向i则p指向的一定是i的最低地址,那么就可以判断p中的值是不是1来确定是不是小端。

  联合体union的存放顺序是所有成员都从低地址开始存放,利用该特性就可以轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写。

/*return 1: little-endian, return 0: big-endian*/
int checkCPUendian()
{
  union
  {
    unsigned int a;
    unsigned char b;
  }c;
  c.a = 1;
  return (c.b == 1);
}

实现同样的功能,来看看Linux 操作系统中相关的源代码是怎么做的:

static union { char c[4]; unsigned long mylong; } endian_test = {{ 'l', '?', '?', 'b' } };

#define ENDIANNESS ((char)endian_test.mylong)

Linux 的内核作者们仅仅用一个union 变量和一个简单的宏定义就实现了一大段代码同样的功能!(如果ENDIANNESS=’l’表示系统为little endian,为’b’表示big endian)

四、一些笔试题目

  char *sz = "0123456789";
  int *p = (int*)sz;
  printf("%x\n",*++p); 

字符'0'对应的十六进制是0x30,请问在x86环境下程序输出是多少?

假设字符串sz地址从@0开始,那么sz在内存的存储为 
@0   @1   @2   @3   @4   @5   @6   @7   @8   @9 
0x30 0x31 0x32 0x33 0x34 0x35 0x36 0x37 0x38 0x39 
当你把char*强制类型转化成int*后,因为int占四个字节,那么p指向@0,并且*p占有的地址是@0@1@2@3,打印的时候 先进行++p操作,那么p指向@4,此时*p占有的地址是@4@5@6@7,根据上面地地址存地位,高地址存高位的解释,那么*p应该等于0x37363534

    int a = 0x12345678;
    char *p = (char*)(&a);
    printf("%x\n",*(p+1));

例如对于0x12345678,网络字节顺序是这样0x12,0x34,0x56,0x78存储的,这种方式称为big-endian
intel处理器是0x78 0x56 0x34 0x12这样来存储的,称为小尾little-endian
在x86环境下题目中的p指向0x78,加1后指向0x56

#include <stdio.h>
union
{
    int i;
    char x[2];
}a;
int main()
{
    a.x[0] = 10;
    a.x[1] = 1;
    printf("%d",a.i);
    return 0;
}

x86下输出答案: 266 (x86下:低位低地址,高位高地址,i内存里存的值是Ox010A,十进制为266)

int main()
{
    union
    {
        int i;
        struct
        {
            char first;
            char second;
        }half;
    }number;
    number.i=0x4241;
    printf("%c %c\n", number.half.first, number.half.second);
    number.half.first='a';
    number.half.second='b';
    printf("%x\n", number.i);
    return 0;
}

x86下输出答案:
       A B   (0x41对应'A',是低位;Ox42对应'B',是高位)
       6261 (number.i和number.half共用一块地址空间0x6261)

 

 

作者:阿凡卢

出处:http://www.cnblogs.com/luxiaoxun/

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

http://www.cnblogs.com/luxiaoxun/archive/2012/09/05/2671697.html

时间: 2025-01-31 05:42:08

大端和小端(Big endian and Little endian)的相关文章

深入理解计算机系统-之-数值存储(一)-CPU大端和小端模式详解

大端与小端 在嵌入式开发中,大端(Big-endian)和小端(Little-endian)是一个很重要的概念. MSB与LSB 最高有效位(MSB)指二进制中最高值的比特.在16比特的数字音频中,其第1个比特便对16bit的字的数值有最大的影响.例如,在十进制的15,389这一数字中,相当于万数那1行(1)的数字便对数值的影响最大.比较与之相反的"最低有效位"(LSB). LSB(Least Significant Bit),意为最低有效位:MSB(Most Significant

《C语言编程魔法书:基于C11标准》——2.6 大端与小端

2.6 大端与小端 现代计算机系统中含有两种存放数据的字节序:大端(Big-endian)和小端(Little-endian).所谓大端字节序是指在读写一个大于1个字节的数据时,其数据的最高字节存放在起始地址单元处,数据的最低字节存放在最高地址单元处.所谓小端字节序是指在读写一个大于1个字节的数据时,其数据的最低字节存放在起始地址单元处,而数据的最高字节存放在最高地址单元处.比如,我们要在地址0x00001000处存放一个0x04030201的32位整数,其大端.小端存放情况如图2-9所示. 当

网络通信时字节序转换原理与网络字节序、大端和小端模式

引言:在进行网络通信时是否需要进行字节序转换?  相同字节序的平台在进行网络通信时可以不进行字节序转换,但是跨平台进行网络数据通信时必须进行字节序转换. 原因如下:网络协议规定接收到得第一个字节是高字节,存放到低地址,所以发送时会首先去低地址取数据的高字节.小端模式的多字节数据在存放时,低地址存放的是低字节,而被发送方网络协议函数发送时会首先去低地址取数据(想要取高字节,真正取得是低字节),接收方网络协议函数接收时会将接收到的第一个字节存放到低地址(想要接收高字节,真正接收的是低字节),所以最后

网络通信之 字节序转换原理与网络字节序、大端和小端模式

原文地址:http://www.cnblogs.com/fuchongjundream/p/3914770.html 一.在进行网络通信时是否需要进行字节序转换?       相同字节序的平台在进行网络通信时可以不进行字节序转换,但是跨平台进行网络数据通信时必须进行字节序转换.      原因如下:网络协议规定接收到得第一个字节是高字节,存放到低地址,所以发送时会首先去低地址取数据的高字节.小端模式的多字节数据在存放时,低地址存放的是低字节,而被发送方网络协议函数发送时会首先去低地址取数据(想要

处理器的大端和小端模式

 大端格式: 在这种格式中,字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中.   小端格式: 与大端存储格式相反,在小端存储格式中,低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节.    请写一个C函数,若处理器是Big_endian的,则返回0:若是Little_endian的,则返回1 解答: int checkCPU( ) {     {            union w            {                     int  a;  

大端(Big Endian)与小端(Little Endian)简介与实现

[大端(Big Endian)与小端(Little Endian)简介]Byte Endian是指字节在内存中的组织,所以也称它为Byte Ordering,或Byte Order.     对于数据中跨越多个字节的对象,我们必须为它建立这样的约定: (1) 它的地址是多少? (2) 它的字节在内存中是如何组织的?     针对第一个问题,有这样的解释:     对于跨越多个字节的对象,一般它所占的字节都是连续的,它的地址等于它所占字节最低地址.(链表可能是个例外, 但链表的地址可看作链表头的地

大端模式&amp;amp;小端模式 主机序&amp;amp;网络序

1. 主机序 不同的CPU有不同的字节序类型这些字节序是指整数在内存中保存的顺序,这个叫做主机序.最常见的有两种: 1.         Little endian:将低序字节存储在起始地址. 即小端模式 2.         Big endian:将高序字节存储在起始地址.    即大端模式 LE little-endian 最符合人的思维的字节序.地址低位存储值的低位,地址高位存储值的高位.怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说低位值小,就应该放在内存地址小的地方,也即内存

C++ 大端小端

小端(高位存在高地址,低位存在低地址)\ union      {           long    Long;       char    Char[sizeof(long)];     }u;          bool    IsBigOrSmall()    //    1-小端(Intel);    0-大端(Motor)     {         u.Long    =    1;         if(    u.Char[0]    ==    1    )         

基于大端法、小端法以及网络字节序的深入理解_C 语言

关于字节序(大端法.小端法)的定义<UNXI网络编程>定义:术语"小端"和"大端"表示多字节值的哪一端(小端或大端)存储在该值的起始地址.小端存在起始地址,即是小端字节序:大端存在起始地址,即是大端字节序. 也可以说: 1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端. 2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端.举