C语言中结构体偏移及结构体成员变量访问方式的问题讨论_C 语言

c语言结构体偏移
示例1

我们先来定义一下需求:

已知结构体类型定义如下:

struct node_t{
 char a;
 int b;
 int c;
};

且结构体1Byte对齐

#pragma pack(1)

求:

结构体struct node_t中成员变量c的偏移。

注:这里的偏移量指的是相对于结构体起始位置的偏移量。

看到这个问题的时候,我相信不同的人脑中浮现的解决方法可能会有所差异,下面我们分析以下几种可能的解法:

方法1

如果你对c语言的库函数比较熟悉的话,那么你第一个想到的肯定是offsetof函数(其实只是个宏而已,先姑且这样叫着吧),我们man 3 offsetof查看函数原型如下:

 #include <stddef.h>

  size_t offsetof(type, member);

有了上述的库函数,我们用一行代码就可以搞定:

offsetof(struct node_t, c);

当然这并非本文探讨的重点,请继续阅读。

方法2

当我们对c语言的库函数不熟悉的时候,此时也不要着急,我们依然可以使用我们自己的方法来解决问题。

最直接的思路是:【结构体成员变量c的地址】 减去 【结构体起始地址】

我们先来定义一个结构体变量node:

struct node_t node;

接着来计算成员变量c的偏移量:

(unsigned long)(&(node.c)) - (unsigned long)(&node)
&(node.c)为结构体成员变量c的地址,并强制转化为unsigned long;

&node为结构体的起始地址,也强制转化为unsigned long;

最后我们将上述两值相减,得到成员变量c的偏移量;

方法3

按照方法2的思路我们在不借助库函数的情况下,依然可以得到成员变量c的偏移量。但作为程序员,我们应该善于思考,是不是可以针对上面的代码做一些改进,使我们的代码变得更简洁一些?在做具体的改进之前,我们应该分析方法2存在哪些方面的问题。

相信不用我多说,细心的你一定已经察觉到,方法2中最主要的一个问题是我们自定义了一个结构体变量node,虽然题目中并未限制我们可以自定义变量,但当我们遇到比较严且题目中不允许自定义变量的时候,此时我们就要思考新的解决方法。

在探讨新的解决方法之前,我们先来探讨一个有关偏移的小问题:

小问题

这是一道简单的几何问题,假设在座标轴上由A点移动到B点,如何计算B相对于A的偏移?这个问题对于我们来说是非常的简单,可能大部分人都会脱口而出并得到答案为B-A。

那么这个答案是否完全准确呢?比较严谨的你觉得显然不是,原因在于,当A为坐标原点即A=0的时候,上述答案B-A就直接简化为B了。

这个小小的简单的问题,对于我们来说有什么启示呢?

我们结合方法2的思路和上述的小问题,是不是很快就得到了下面的关联:

(unsigned long)(&(node.c)) - (unsigned long)(&node)

B - A
我们小问题的思路是当A为坐标原点的时候,B-A就简化为B了,那么对应到我们的方法2,当node的内存地址为0即(&node==0)的时候,上面的代码可简化为:

(unsigned long)(&(node.c))
由于node内存地址==0了,所以

node.c  //结构体node中成员变量c

我们就可以使用另外一种方式来表达了,如下:

((struct node_t *)0)->c
上述代码应该比较好理解,由于我们知道结构体的内存地址编号为0,所以我们就可以直接通过内存地址的方式来访问该结构体的成员变量,相应的代码的含义就是 获取内存地址编号为0的结构体struct node_t的成员变量c。

此时,我们的偏移求法就消除了struct node_t node这个自定义变量,直接一行代码解决,:

(unsigned long)(&(((struct node_t *)0)->c))
上述的代码相对于方法2是不是更简洁了一些。

这里我们将上面的代码功能定义为一个宏,该宏的作用是用来计算某结构体内成员变量的偏移(后面的示例会使用该宏):

#define OFFSET_OF(type, member) (unsigned long)(&(((type *)0)->member))

使用上面的宏,就可以直接得到成员变量c在结构体struct node_t中的偏移为:

OFFSET_OF(struct node_t, c)

示例2

和示例1一样,我们先定义需求如下:

已知结构体类型定义如下:

struct node_t{
 char a;
 int b;
 int c;
};

int *p_c,该指针指向struct node_t x的成员变量c

结构体1Byte对齐

#pragma pack(1)

求:

结构体x的成员变量b的值?

拿到这个问题的时候,我们先做一下简单的分析,题目的意思是根据一个指向某结构体成员变量的指针,如何求该结构体的另外一个成员变量的值。

那么可能的几种解法有:

方法1

由于我们知道结构体是1Byte对齐的,所以这道题最简单的解法是:

*(int *)((unsigned long)p_c - sizeof(int))
上述代码很简单,成员变量c的地址减去sizeof(int)从而得到成员变量b的地址,然后再强制转换为int *,最后再取值最终得到成员变量b的值;

方法2

方法1的代码虽然简单,但扩展性不够好。我们希望通过p_c直接得到指向该结构体的指针p_node,然后通过p_node访问该结构体的任意成员变量了。

由此我们得到计算结构体起始地址p_node的思路为:

【成员变量c的地址p_c】减去【c在结构体中的偏移】

由示例1,我们得到结构体struct node_t中成员变量c的偏移为:

(unsigned long)&(((struct node_t *)0)->c)
所以我们得到结构体的起始地址指针p_node为:

(struct node_t *)((unsigned long)p_c - (unsigned long)(&((struct node_t *)0)->c))
我们也可以直接使用示例1中定义的OFFSET_OF宏,则上面的代码变为:

(struct node_t *)((unsigned long)p_c - OFFSET_OF(struct node_t, c))
最后我们就可以使用下面的代码来获取成员变量a,b的值:

p_node->a

p_node->b
我们同样将上述代码的功能定义为如下宏:

#define STRUCT_ENTRY(ptr, type, member) (type *)((unsigned long)(ptr)-OFFSET_OF(type, member))

该宏的功能是通过结构体任意成员变量的指针来获得指向该结构体的指针。

我们使用上面的宏来修改之前的代码如下:

STRUCT_ENTRY(p_c, struct node_t, c)

p_c为指向结构体struct node_t成员变量c的指针;

struct node_t结构体类型;

c为p_c指向的成员变量;

注:

上述示例中关于地址运算的一些说明:

int a = 10;
int * p_a = &a;

设p_a == 0x95734104;

以下为编译器计算的相关结果:

  • p_a + 10 == p_a + sizeof(int)*10 =0x95734104 + 4*10 = 0x95734144
  • (unsigned long)p_a + 10 == 0x95734104+10 = 0x95734114
  • (char *)p_a + 10 == 0x95734104 + sizeof(char)*10 = 0x95734114

从上述三种情况,相信你应该能体会到我所要表达的意思了。

结构体成员变量访问方式
访问结构体成员变量?如此简单的问题,有什么可以思考的呢?很纳闷也很奇怪。既然这样,那就带着这个奇怪的问题继续阅读吧。

示例3

我们的探讨还是从一个简单的示例开始:

已知结构体类型定义如下:

struct node_t {
 char a;
 int b;
 int c;
};

且结构体1Byte对齐:

#pragma pack(1)

接下来我们探讨几种访问该结构体成员变量c的方式:

情形1

如果程序中定义了一个struct node_t类型的变量node如下:

struct node_t node;

那么我们就可以直接通过下面的方式来访问成员变量c:

node.c

情形2

如果程序中定义了一个指向struct node_t类型的指针p_node如下:

struct node_t node;
struct node_t *p_node = &node;

或者在堆上分配了一块类型为struct node_t的内存如下:

struct node_t *p_node= (struct node_t *)malloc(sizeof(struct node_t));

那么我们就可以使用下面的方式来访问成员变量c:

p_node -> c;

情形3

上述两种访问方式都是比较常见的,也是大家所熟悉的,下面我们来探讨一种大家不是特别熟悉也不是很常见的情形:

如果程序中只给定了一个内存地址数值addr_node,且该地址addr_node起始的一段内存,指向一块类型为struct node_t的内存,addr_node声明如下:

unsigned long addr_node;

此时,我们如何根据这块内存地址来访问成员变量c呢?

由于我们知道了该结构体的起始地址addr_node,所以我们对其进行强制类型转换,从而得到一个指向该结构体的指针p_node:

struct node_t *p_node = (struct node_t *)addr_node;

接下来我们就可以通过情形2的方式来访问成员变量c了;

情形3要传达的意思是,我们可以通过一个具体的内存地址数值来访问我们的结构体成员变量;

关于情形3的一点说明

((struct node_t *)0)->c
我们通过内存地址0来访问结构体struct node_t成员变量c,但这里面有几点需要说明一下:

1. 我们并未对内存地址0做过任何内存相关操作,如解引用、赋值等,即内存地址编号0开始的一段内存无任何变化;

2. 我们只是利用了编译器的特性来帮助我们计算结构体的偏移,仅仅是利用了编译器的特性来计算而已;

3. 善于利用编译器的一些特性来优化我们的程序或系统;

结论

本文主要介绍了c语言中关于访问结构体成员变量的几种方式,并对通过内存地址数值直接访问结构体成员变量做了说明,解释了上篇博文中可能产生疑问的一个问题。

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索c语言
, 结构体
, 偏移
成员变量访问
结构体成员偏移量、获取结构体成员偏移、计算结构体成员偏移量、c语言结构体成员赋值、c语言 遍历结构体成员,以便于您获取更多的相关知识。

时间: 2024-10-03 13:05:42

C语言中结构体偏移及结构体成员变量访问方式的问题讨论_C 语言的相关文章

C语言中多维数组的内存分配和释放(malloc与free)的方法_C 语言

如果要给二维数组(m*n)分配空间,代码可以写成下面: 复制代码 代码如下: char **a, i; // 先分配m个指针单元,注意是指针单元 // 所以每个单元的大小是sizeof(char *) a = (char **) malloc(m * sizeof(char * )); // 再分配n个字符单元, // 上面的m个指针单元指向这n个字符单元首地址 for(i = 0; i < m; i++) a[i] = (char * )malloc(n * sizeof(char )); 释

Java中任何时候this均不能引用成员变量?

问题描述 Java中任何时候this均不能引用成员变量? 解决方案 解决方案二:什么问题?TorF?解决方案三:why?你自己开发的java语言这样规定?解决方案四:兄弟什么意思啊!!

Java中成员方法与成员变量访问权限详解_java

记得在一次面试的笔试题中,有的面试官会要求写出具体的像pullic这些访问限定符的作用域.其实,平常我都没去系统的考虑这些访问限定符的作用域,特别是包内包外的情况,OK,笔试不行了.  这是java基本的知识,也是公司看重的,那没办法啦,我的脑袋记不住东西,那我只能把这些东西写下来方便自己温故知新,不废话了,贴代码了. 代码如下: package com.jaovo; /** *_1_ 成员变量访问权限的求证 * public private protected default(默认的权限) *

C语言中如何判断int和long型等变量是否赋值

博主这段时间在写一些C程序的代码,由于以前对C不是了解很多,故遇到很多瓶颈,当然,其中也有很多 有趣的方法可以利用以解决这些难题,下面这个问题就是博主遇到的一个麻烦. 声明了 int ,long 型等局部变量,在利用一些方法给这些变量赋值之后,想判断这些变量是不是真的被赋初值了,怎么办? 当然,如果你不赋值给局部变量,这样会导致整个程序的崩溃,因为,它的内容被系统指向了垃圾内 存. 下面我们看一段代码: #include <stdio.h> #include <string.h>

解析C++中派生的概念以及派生类成员的访问属性_C 语言

C++继承与派生的概念.什么是继承和派生 在C++中可重用性是通过继承(inheritance)这一机制来实现的.因此,继承是C++的一个重要组成部分. 前面介绍了类,一个类中包含了若干数据成员和成员函数.在不同的类中,数据成员和成员函数是不相同的.但有时两个类的内容基本相同或有一部分相同,例如巳声明了学生基本数据的类Student: class Student { public: void display( ) //对成员函数display的定义 { cout<<"num: &qu

C++中的按位与&amp;、按位与或|、按位异或^运算符详解_C 语言

按位与运算符:& 语法 expression & expression 备注 表达式可以是其他"与"表达式,或(遵循下面所述的类型限制)相等表达式.关系表达式.加法表达式.乘法表达式.指向成员的指针表达式.强制转换表达式.一元表达式.后缀表达式或主表达式. 按位"与"运算符 (&) 会将第一操作数的每一位与第二操作数的相应位进行比较.如果两个位均为 1,则对应的结果位将设置为 1.否则,将对应的结果位设置为 0. 按位"与"

深入理解C++中变量的存储类别和属性_C 语言

C++变量的存储类别(动态存储.静态存储.自动变量.寄存器变量.外部变量)动态存储方式与静态存储方式 我们已经了解了变量的作用域.作用域是从空间的角度来分析的,分为全局变量和局部变量. 变量还有另一种属性--存储期(storage duration,也称生命期).存储期是指变量在内存中的存在期间.这是从变量值存在的时间角度来分析的.存储期可以分为静态存储期(static storage duration)和动态存储期(dynamic storage duration).这是由变量的静态存储方式和

详解在C++中显式默认设置的函数和已删除的函数的方法_C 语言

在 C++11 中,默认函数和已删除函数使你可以显式控制是否自动生成特殊成员函数.已删除的函数还可为您提供简单语言,以防止所有类型的函数(特殊成员函数和普通成员函数以及非成员函数)的参数中出现有问题的类型提升,这会导致意外的函数调用. 显式默认设置的函数和已删除函数的好处 在 C++ 中,如果某个类型未声明它本身,则编译器将自动为该类型生成默认构造函数.复制构造函数.复制赋值运算符和析构函数.这些函数称为特殊成员函数,它们使 C++ 中的简单用户定义类型的行为如同 C 中的结构.也就是说,可以创

C/C++的浮点数在内存中的存储方式分析及实例_C 语言

C/C++的浮点数在内存中的存储方式分析 任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100.则在Intel CPU架构的系统中,存放方式为  10000100(低地址单元) 00000100(高地址单元),因为Intel CPU的架构是小端模式.但是对于浮点数在内存是如何存储的?目前所有的C/C++编译器都是采用IEEE所制定的标准浮点格式,即二进制科学表示法.        在二进制科学表示法中,S=M*2^N 主