深入探讨this指针

深入探讨this指针



 



为了写这篇文章,准备了好长时间,翻遍了箱底的书籍。但是现在还是不敢放开手来写,战战兢兢。不是担心自己写错,而是唯恐自己错误误导别人。同时也希望这篇文章能给你一点收获。既然是深入探讨this指针,所以建议初学者,最好具有一定编译基础,调试基础。如果大家认为这片文章有不满的地方,就给我发信批评一下,以便及时修正。

关于this指针的描述我们一般从语言层次上讲;

this指针作为一个隐含参数传递给非静态成员函数,用以指向该成员函数所属类所定义的对象。当不同的对象调用同一个类的成员函数代码时,编译器会依据该成员函数的this指针所指向的不同对象来确定应该引用哪个对象的数据成员。简单例子

我们定义一个简单stack类

// 定义stack类

class Stack

{

public:

     Stack();// 构造函数

     ~Stack();// 析构函数

public:

     void push(char c);// 压栈函数

private:

     char *top;// 栈顶元素

     char *max;// 栈容量

};

 

// 压栈函数

void Stack::push(char c)

{

     if(top > max)

     {

         ERROR;

     }

     *top++ = c;

}

 

// 定义公共函数,操作栈对象中的push函数

void FunStack(Stack *p)

{

     p->push('c');

}

上面的代码我们加入this概念,以C代码形式显示(你可以理解编译C++成C代码后,Cfront开始就是这么做的)

// 用普通C描述类成员函数

void Stack__push(this,c);// 普通C代码

{

     if(this->top > this->max)

     {

         ERROR;

     }

     *(this->top)++ = c;

}

 

void FunStack(p)// Stack *p;

{

     Stack__push(p,'c');

}

C++中this指针是从Simula(只是听说没有使用过)里的THIS引用的翻版,有时候有人会问,为什么this是指针而不是一个引用?为什么叫this而不是叫self(smalltalk)?第一个问题是,当this引入带类的C时,在那时的是C++中还没有引用机制,所以只能是this指针而不是引用了。第二个问题,更简单了,就是因为this是从simula来,而不是从smalltalk来。

    上面是简单的讨论,我们将逐步深入讨论this。

我们通过this访问对象(已经成惯例了)中函数和变量时一般这样使用

    this->top;// 访问变量

    this->push();// 访问函数

 

    (*this).top;// 访问变量

    (*this).push();// 访问函数

通过上面例子,我们从语言层次上说this是一个指针(也许你说this本来就是一个指针,就叫this指针,不要着急听我慢慢说来)。那么this是一个什么样子的指针,比如我们最常见的指针有。

    int *p;

    Const int *p;

    int * const p;

那么this指针是不是其中一种?下面我们分别验证。

    我们定义类,作为验证对象

    class A

{

public:

     int iData;// 简单期间我们定义为int型

     mutable int iData2;// mutable变量

int Fun1(){return ++iData;};// 普通函数㈠

     int Fun2() const {return ++iData;};// 带const的函数㈡

};

上面的㈠函数可以正确执行。

上面㈡函数,不能通过编译,我们知道在const函数中,不允许修改类中变量。那么最终原因是什么?其实在上面的例子中,我们用C实现

int A_Fun2(const A* this);

const函数本质是const this的原因,所以不允许修改iData值。

至少现在我们可以确定this指针,不是一个const常量指针。因为如果this是常量指针,我们就不能修改类中变量的值了。捎带我们提一下C++中关键字mutable,如上定义的mutable int iData2;// mutable变量,这样我们就可以在const函数中修改iData2的值。其实这时的mutable和public,private,protected是相同的,这些关键字只是在编译时刻有用,编译后变量类型是没有区别的。更深一步说,强制类型转换也是对编译器来说,是通过编译器编译过程中判断类型转换的正误。

    那么this对象是否是A *const this的值哪?首先我们先看一个例子

 

static int iTest = 1;

class A

{

public:

     int iData;// 简单期间我们定义为int型

     mutable int iData2;// mutable变量

     int Fun1()

     {

         int iTemp = 4;

         return ++iData;

     };// 普通函数

     int Fun2()const {return iData;};// 带const的函数

};

 

int _tmain(int argc, _TCHAR* argv[])

{

     A a;

static int iTest1 = 2;

     a.Fun1();

static int iTest2 = 3;

system("pause");

     return 0;

}

我们通过上面的例子查看this的地址,我们定义static对象的目的就是为了用this指针的地址和static变量的地址进行对比,看一看this指针到底分配到哪里?

    注意我们在这里不能直接使用&this获得this的指针,如果我们这样定义会提示

Error C2102 &要求一个L值



    通过上面至少我们知道,this不是一个个人定义的变量,只是在运行时刻有效。所以这时如果直接对this取地址,在编译时刻无法通过,提示如上错误。

    既然我们在程序中无法通过&this取得this的地址。那么我们有什么办法取得this的地址?我们上面已经提到this是在运行时刻有效,我们就以据这点查找this的地址。

    为了在取得this的地址,我们使用VC7.0下的命令窗口,在命令窗口中我们使用命令eval,通过这个命令我们可以取得this的地址。我们还是在上面的程序中设置断点

 

在debug下,我们运行上面的程序,并进入断点后,进行取址操作。

>eval &iTest

0x0044afa0 iTest

>eval &iTest1

0x0044afa4 iTest1

>eval &this// 注意只有我们进入Fun1()函数体内才能取得&this的值

0x0012fdf0 "玄_"

>eval &iTest2

0x0044afa8 iTest2

 

通过对比我们可以看出static变量iTest,iTest1,iTest2存放在全局变量区域,而&this(0x0012fdf0)的地址比&iTest(0x0044afa0)地址还要底,而static变量存放在单独全局

区域,并且这个区域是从底地址到高地址递增的。所以通过上面的对比至少我们可以肯定一点this指针的创建要比static变量(或者全局变量)早。那么更比创建A a;对象时调用A的构造函数早,只是创建a对象后,this指向a对象;

当我们创建两个A类对象时,会发现this指针的地址是相同的,但是this指针指向对象不同。当然不同了,如果相同。A a,b;那么a,b对象也就相同了,这种方式肯定是不对的。结论就是同一个类创建多个对象时,多个对象的this指针是同一个指针。也就是说在单进程单线程中this对象在放入CPU寄存器中时都是同一个地址,只是指向不同的对象而已。上面的测试是在DEBUG状态下的测试结果。

那么在Release是什么样?要多亏VC7.0支持Release下的断点,我们在Release下,启动调试。这时需要在Release状态下设置,优化状态为禁用(/Od)

>eval &this CXX0069: 错误: 变量需要堆栈帧

>eval this CXX0069: 错误: 变量需要堆栈帧

>eval *this CXX0069: 错误: 变量需要堆栈帧

 

    在Release状态下&this,this,*this不存在了,提示是变量需要堆栈帧,说明此时的this指针不存在了。难到this指针只是在debug模式下有,在Release模式下没有?而C++语言特性中并没有说this指针在调试状态下有而在Release模式下没有啊?只是强调this指针作为一种隐含参数传递。也就是在正确(请这样理解)的程序中this应该是不存在的,至少可以肯定的是说在内存中不存在this指针。

    我们使用C++的时候知道有一种变量定义方式,也不存放到内存,而是直接放到寄存器中。我想你已经猜到了就是register类型变量,下面我们测试register类型变量是否和this指针是一样的结果。

    在程序中定义:register int iRegData;

    Debug模式下

>eval iRegData

5

>eval &iRegData

0x0012fec4// 注意这个地址,看看是否和>eval &this// 注意只有我们进入Fun1()函数体内才能取得&this的值0x0012fdf0 "玄_"在地址上很接近啊!一个是0x0012fec4,另一个是0x0012fdf0。

    Release模式下

>eval iRegData

5

>eval &iRegData

0x0012fee0

通过上可以知道在debug和Release模式下iRegData都没有直接放入寄存器,而是在内存中开辟了内存空间,至于如何可以在运行时候看出register变量是放到寄存器,而不是内存中,我还不得而知,所以哪位高人知道,麻烦告诉我一声。看来this指针也不是register类型的,或者我现在的能力还不能确定this是register。后来才知道register对编译器只是一个提示,编译器可以执行也可以不执行,就像inline一样。但是至少我们可以使用__inline宏,可以确保函数被inline,但是register?有没有这种策略,我现在还不得而知。

补充:定义变量类型有四中分别是

1:Auto:非static,const类型变量,比如局部变量,int i;char c等。都是auto int i;auto char c;

2:static:静态变量,static int i,static char c;

3:const:常量变量,值不可修改。Const int i,static char c;

4:register:内存变量,编译器把此值直接放入寄存器。Register int i;register char c;

上面讨论我们都是从类中变量进行讨论的,但是无法确定this到底是什么?那么我们继续从类中的函数开始讨论this。并且我们也将逐渐深入编译状态下。

开始的使用已经举了例子,类内函数在解释函数时,把this指针作为函数的第一个参数进行传递。但是,当高级语言被编译成计算机可以识别的机器码时,有一个问题就凸现出来:在CPU中,计算机没有办法知道一个函数调用需要多少个、什么样的参数,也没有硬件可以保存这些参数(你讲看到this是一个例外)。也就是说,计算机不知道怎么给这个函数传递参数,传递参数的工作必须由函数调用者和函数本身来协调。为此,计算机提供了一种被称为栈的数据结构来支持参数传递。
    栈是一种先进后出的数据结构,栈有一个存储区、一个栈顶指针。栈顶指针指向堆栈中第一个可用的数据项(被称为栈顶)。用户可以在栈顶上方向栈中加入数据,这个操作
被称为压栈(Push),压栈以后,栈顶自动变成新加入数据项的位置,栈顶指针也随之修
改。用户也可以从堆栈中取走栈顶,称为弹出栈(pop),弹出栈后,栈顶下的一个元素变
成栈顶,栈顶指针随之修改。

函数调用时,调用者依次把参数压栈,然后调用函数,函数被调用以后,在堆栈中取得数据,并进行计算。函数计算结束以后,或者调用者、或者函数本身修改堆栈,使堆栈恢复原装。在参数传递中,有两个很重要的问题必须得到明确说明:当参数个数多于一个时,按照什么顺序把参数压入堆栈函数调用后,由谁来把堆栈恢复原装在高级语言中,通过函数调用约定来说明这两个问题。常见的调用约定有:

stdcall
cdecl
fastcall
thiscall
naked call

原来函数调用约定也有这么多啊,看这都有点晕了呵呵。因为这篇文章讲的是this指针,所以在这里我们主要讨论thiscall。

       thiscall是唯一一个不能明确指明的函数修饰,因为thiscall不是关键字(所以不要在C++关键字中找了)。它是C++类成员函数缺省的调用约定。由于成员函数调用有一个this指针,因此必须特殊处理,thiscall意味着:参数从右向左入栈,如果参数个数确定,this指针通过ecx传递给被调用者;如果参数个数不确定,this指针在所有参数压栈后被压入堆栈。对参数个数不定的,调用者清理堆栈,否则函数自己清理堆栈为了说明这个调用约定,定义如下类和使用代码:

class A
{
public:
int function1(int a,int b);
int function2(int a,...);// 定义VA(可变)函数
};
int A::function1 (int a,int b)
{
return a+b;
}

int A::function2(int a,...)
{
va_list ap;
va_start(ap,a);
int i;
int result = 0;
for(i = 0 i < a i ++)
{
result += va_arg(ap,int);
}
return result;
}
void callee()
{
A a;
a.function1 (1,2);
a.function2(3,1,2,3);
}
callee函数被翻译成汇编后就变成:
//函数function1调用
0401C1D push 2
00401C1F push 1
00401C21 lea ecx,[ebp-8]
00401C24 call function1 // 注意,这里this没有被入栈,而是通过ECX传递this指针

此时寄存器的各值如下

EAX = 00000003 EBX = 7FFDF000 ECX = 0012EE43

EDX = 00000001 ESI = 00000000 EDI = 0012EE48

EIP = 0041707A ESP = 0012ED70 EBP = 0012EE48

EFL = 00000206

察看this指针

>eval this

0x0012ee43// 看看这个值是否和ECX相同
//函数function2调用
00401C29 push 3
00401C2B push 2
00401C2D push 1
00401C2F push 3
00401C31 lea eax,[ebp-8] // 这里引入this指针,并把this指针放入栈内

EAX = 00000006 EBX = 7FFDF000 ECX = 0012ED70

EDX = 00000006 ESI = 00000000 EDI = 0012EE48

EIP = 0041708E ESP = 0012ED70 EBP = 0012EE48

EFL = 00000212

察看this指针

>eval this

0x0012ee43// 看看这个值是否和ECX相同
00401C34 push eax
00401C35 call function2
00401C3A add esp,14h

 

到现在,我们对this得了解还说不上深入了解。简单得说this就是指向对象自身的一个指针,讨论这么多其实就是想了解this在反编译阶段是如何传递运行得。也许就this的了解我们就可以基于以上讨论已经足够了。但是this的应用并不简单的就是这些内容,比如在ATL中,就有专门函数用来保存回复this指针的策略;我们在重载operator=也需要通过this判断赋值等号两边对象,是否指向同一个对象。

 

关于指针:指针和其它变量(int,char等)一样,在声明后会在内存中申请内存空间,存储在在程序的堆栈上,大小一般都是一个机器字的长度(比如在32位机上是4个字节)。简单的说指针是指向内存中地址的变量,可以是数据的地址也可以是函数的地址。一句话:指针是一种用于储存“另外一个变量的地址”的变量。或者拆成两句:指针是一个变量,它的值是另外一个变量的地址。

 



参考资料



孙晓涛等《Windows高级编程》西北工业大学出版社(1997年10月 西安)

逸学堂《关于this指针的深入探讨》CSDN

《C++编程思想》

 

 

时间: 2024-11-03 23:21:56

深入探讨this指针的相关文章

C++指针探讨(一)数据指针

指针,在C/C++语言中一直是很受宠的:几乎找不到一个不使用指针的C/C++应用.用于存储数据和程序的地址,这是指针的基本功能.用于指向整型数,用整数指针(int*):指向浮点数用浮点数指针(float*):指向结构,用对应的结构指针(struct xxx *):指向任意地址,用无类型指针(void*). 有时候,我们需要一些通用的指针.在C语言当中,(void*) 可以代表一切:但是在C++中,我们还有一些比较特殊的指针,无法用(void*)来表示.事实上,在C++中,想找到一个通用的指针,特

C++指针探讨(四)函数对象

函数对象不是函数指针.但是,在程序代码中,它的调用方式与函数指针一样,后面加个括号就可以了. 这是入门级的随笔,说的是函数对象的定义,使用,以及与函数指针,成员函数指针的关系. 沐枫小筑 函数对象实质上是一个实现了operator()--括号操作符--的类. 例如: class Add { public: int operator()(int a, int b) { return a + b; } }; Add add: // 定义函数对象 cout << add(3,2): // 5 函数指

C++指针探讨(三)成员函数指针

C语言的指针相当的灵活方便,但也相当容易出错.许多C语言初学者,甚至C语言老鸟都很容易栽倒在C语言的指针下.但不可否认的是,指针在C语言中的位置极其重要,也许可以偏激一点的来说:没有指针的C程序不是真正的C程序. 然而C++的指针却常常给我一种束手束脚的感觉.C++比C语言有更严格的静态类型,更加强调类型安全,强调编译时检查.因此,对于C语言中最容易错用的指针,更是不能放过:C++的指针被分成数据指针,数据成员指针,函数指针,成员函数指针,而且不能随便相互转换.而且这些指针的声明格式都不一样:

C++指针探讨(二)函数指针

在C/C++中,数据指针是最直接,也最常用的,因此,理解起来也比较容易.而函数指针,作为运行时动态调用(比如回调函数 CallBack Function)是一种常见的,而且是很好用的手段. 我们先简单的说一下函数指针.(这一部份没什么价值,纯是为了引出下一节的内容) 2 常规函数指针 void(*fp)(): fp 是一个典型的函数指针,用于指向无参数,无返回值的函数. void(*fp2)(int): fp2 也是一个函数指针,用于指向有一个整型参数,无返回值的函数. 当然,有经验人士一般都会

javascript中this指针探讨

javascript是一门类java语言有很多跟java相类似的特点,但也仅是类似而已,真正使用中还是有很大的差别.this指针常常让很多初学者抓狂,本人也曾为此困惑不解,查找过很多资料,今天在这里总结一下,希望能帮助后来者更快驯服这只拦路虎.网上有很多讲解this指针的文章其中不乏精品,以我看来了解this指针关键在于掌握javascript中函数的四种调用模式.那么什么是调用?调用指的是跟在任何产生一个函数值的表达式之后使用"()",obj.f()这种方式成为调用,obj.f这种方

探讨C++中数组名与指针的用法比较分析_C 语言

指针是C/C++语言的特色,而数组名与指针有太多的相似,甚至很多时候,数组名可以作为指针使用.但是数组名有些地方又不同于指针.这里将数组名与指针用法的不同做一下总结(有些资料来自互联网),不妥之处,还望指正!(本文程序在WIN32平台下编译):1.数组名和指向那个数组的指针,地址相同,但大小不同用例子来说明: 复制代码 代码如下: #include "stdafx.h"#include <iostream>using namespace std;int _tmain(int

QML与指针

                 在QML刚刚出来不久,参加nokia的一个Qt Quick培训的时候,QML就给我的印象是:解释性脚本语言,没有内存操作的说法,更不用说指针了.当时也就是想想,也没有具体去实践探讨.由于现在在用Qt做产品,UI方面不得不跟QML打交道.QML做UI可以说是又好又快,大大节省了开发周期,但是由于QML处理逻辑的能力较差,所以,对于大量的逻辑处理还是需要Qt C++支持.这就涉及到C++与QML解释性语言之间数据交换.                 QML在和C+

Ajax的错误处理机制探讨(2)

ajax|错误|错误处理 实际的例子:把客户端错误传递到服务器上 现在我们知道了XMLHttpRequest和JavaScript错误处理的一些基础知识了,我们来看一个同时使用了两者的实现例子.你可能认为JavaScript错误可以很简单地在流行的"黄色死亡三角"中显示出来,但是仍然有一些错误传递到了几家篮筹股公司的公共web站点的质量部门了. 因此,我将提供一个用于捕捉错误并把错误记录到服务器上的方法,这样其他人就可能修补这些问题.首先,我们考虑客户端.客户端必须提供一个类,它被用作

深度探讨PHP之性能

  1.缘起 关于PHP,很多人的直观感觉是PHP是一种灵活的脚本语言,库类丰富,使用简单,安全,非常适合WEB开发,但性能低下.PHP的性能是否真的就 如同大家的感觉一样的差呢?本文就是围绕这么一个话题来进行探讨的.从源码.应用场景.基准性能.对比分析等几个方面深入分析PHP之性能问题,并通过真 实的数据来说话. 2.从原理分析PHP性能 从原理分析PHP的性能,主要从以下几个方面:内存管理.变量.函数.运行机制来进行分析. 2.1内存管理 类似Nginx的内存管理方式,PHP在内部也是基于内