C/C++中手动获取调用堆栈【转】

转自:http://blog.csdn.net/kevinlynx/article/details/39269507

版权声明:本文为博主原创文章,未经博主允许不得转载。

当我们的程序core掉之后,如果能获取到core时的函数调用堆栈将非常有利于定位问题。在Windows下可以使用SEH机制;在Linux下通过gdb使用coredump文件即可。

但有时候由于某些错误导致堆栈被破坏,发生拿不到调用堆栈的情况。

一些基础预备知识本文不再详述,可以参考以下文章:

需要知道的信息:

  • 函数调用对应的call指令本质上是先压入下一条指令的地址到堆栈,然后跳转到目标函数地址
  • 函数返回指令ret则是从堆栈取出一个地址,然后跳转到该地址
  • EBP寄存器始终指向当前执行函数相关信息(局部变量)所在栈中的位置,ESP则始终指向栈顶
  • 每一个函数入口都会保存调用者的EBP值,在出口处都会重设EBP值,从而实现函数调用的现场保存及现场恢复
  • 64位机器增加了不少寄存器,从而使得函数调用的参数大部分时候可以通过寄存器传递;同时寄存器名字发生改变,例如EBP变为RBP

在函数调用中堆栈的情况可用下图说明:

将代码对应起来:

[cpp] view plain copy

  1. void g() {  
  2.     int *p = 0;  
  3.     long a = 0x1234;  
  4.     printf("%p %x\n", &a, a);  
  5.     printf("%p %x\n", &p, p);  
  6.     f();  
  7.     *p = 1;  
  8. }  
  9.   
  10. void b(int argc, char **argv) {  
  11.     printf("%p %p\n", &argc, &argv);  
  12.     g();  
  13. }  
  14.   
  15. int main(int argc, char **argv) {  
  16.     b(argc, argv);  
  17.     return 0;  
  18. }  

在函数g()中断点,看看堆栈中的内容(64位机器):

[plain] view plain copy

  1. (gdb) p $rbp  
  2. $2 = (void *) 0x7fffffffe370  
  3. (gdb) p &p  
  4. $3 = (int **) 0x7fffffffe368  
  5. (gdb) p $rsp  
  6. $4 = (void *) 0x7fffffffe360  
  7. (gdb) x/8ag $rbp-16  
  8. 0x7fffffffe360: 0x1234  0x0  
  9. 0x7fffffffe370: 0x7fffffffe390  0x400631 <b(int, char**)+43>  
  10. 0x7fffffffe380: 0x7fffffffe498  0x1a561cbc0  
  11. 0x7fffffffe390: 0x7fffffffe3b0  0x40064f <main(int, char**)+27>  

对应的堆栈图:

可以看看例子中0x400631 <b(int, char**)+43>0x40064f <main(int, char**)+27>中的代码:

[plain] view plain copy

  1. (gdb) disassemble 0x400631  
  2. ...  
  3. 0x0000000000400627 <b(int, char**)+33>: callq  0x400468 <printf@plt>  
  4. 0x000000000040062c <b(int, char**)+38>: callq  0x4005ae <g()>  
  5. 0x0000000000400631 <b(int, char**)+43>: leaveq                           # call的下一条指令  
  6. ...  
  7.   
  8. (gdb) disassemble 0x40064f  
  9. ...   
  10. 0x000000000040063f <main(int, char**)+11>:      mov    %rsi,-0x10(%rbp)  
  11. 0x0000000000400643 <main(int, char**)+15>:      mov    -0x10(%rbp),%rsi  
  12. 0x0000000000400647 <main(int, char**)+19>:      mov    -0x4(%rbp),%edi  
  13. 0x000000000040064a <main(int, char**)+22>:      callq  0x400606 <b(int, char**)>  
  14. 0x000000000040064f <main(int, char**)+27>:      mov    $0x0,%eax         # call的下一条指令  
  15. ...  

顺带一提,每个函数入口和出口,对应的设置RBP代码为:

[plain] view plain copy

  1. (gdb) disassemble g  
  2. ...  
  3. 0x00000000004005ae <g()+0>:     push   %rbp               # 保存调用者的RBP到堆栈  
  4. 0x00000000004005af <g()+1>:     mov    %rsp,%rbp          # 设置自己的RBP  
  5. ...  
  6. 0x0000000000400603 <g()+85>:    leaveq                    # 等同于:movq %rbp, %rsp  
  7.                                                           #         popq %rbp  
  8. 0x0000000000400604 <g()+86>:    retq                        

由以上可见,通过当前的RSP或RBP就可以找到调用堆栈中所有函数的RBP;找到了RBP就可以找到函数地址。因为,任何时候的RBP指向的堆栈位置就是上一个函数的RBP;而任何时候RBP所在堆栈中的前一个位置就是函数返回地址。

由此我们可以自己构建一个导致gdb无法取得调用堆栈的例子:

[cpp] view plain copy

  1. void f() {  
  2.     long *p = 0;  
  3.     p = (long*) (&p + 1); // 取得g()的RBP  
  4.     *p = 0;  // 破坏g()的RBP  
  5. }  
  6.   
  7. void g() {  
  8.     int *p = 0;  
  9.     long a = 0x1234;  
  10.     printf("%p %x\n", &a, a);  
  11.     printf("%p %x\n", &p, p);  
  12.     f();  
  13.     *p = 1; // 写0地址导致一次core  
  14. }  
  15.   
  16. void b(int argc, char **argv) {  
  17.     printf("%p %p\n", &argc, &argv);  
  18.     g();  
  19. }  
  20.   
  21. int main(int argc, char **argv) {  
  22.     b(argc, argv);  
  23.     return 0;  
  24. }  

使用gdb运行该程序:

[plain] view plain copy

  1. Program received signal SIGSEGV, Segmentation fault.  
  2. g () at ebp.c:37  
  3. 37          *p = 1;  
  4. (gdb) bt  
  5. Cannot access memory at address 0x8  
  6. (gdb) p $rbp  
  7. $1 = (void *) 0x0  

bt无法获取堆栈,在函数g()中RBP被改写为0,gdb从0偏移一个地址长度即0x8,尝试从0x8内存位置获取函数地址,然后提示Cannot access memory at address 0x8

RBP出现了问题,我们就可以通过RSP来手动获取调用堆栈。因为RSP是不会被破坏的,要通过RSP获取调用堆栈则需要偏移一些局部变量所占的空间:

[plain] view plain copy

  1. (gdb) p $rsp  
  2. $2 = (void *) 0x7fffffffe360  
  3. (gdb) x/8ag $rsp+16             # g()中局部变量占16字节  
  4. 0x7fffffffe370: 0x7fffffffe390  0x400631 <b(int, char**)+43>  
  5. 0x7fffffffe380: 0x7fffffffe498  0x1a561cbc0  
  6. 0x7fffffffe390: 0x7fffffffe3b0  0x40064f <main(int, char**)+27>  
  7. 0x7fffffffe3a0: 0x7fffffffe498  0x100000000  

基于以上就可以手工找到调用堆栈:

[plain] view plain copy

  1. g()  
  2. 0x400631 <b(int, char**)+43>  
  3. 0x40064f <main(int, char**)+27>  

上面的例子本质上也是破坏堆栈,并且仅仅破坏了保存了的RBP。在实际情况中,堆栈可能会被破坏得更多,则可能导致手动定位也较困难。

堆栈被破坏还可能导致更多的问题,例如覆盖了函数返回地址,则会导致RIP错误;例如堆栈的不平衡。导致堆栈被破坏的原因也有很多,例如局部数组越界;delete/free栈上对象等

omit-frame-pointer

使用RBP获取调用堆栈相对比较容易。但现在编译器都可以设置不使用RBP(gcc使用-fomit-frame-pointer,msvc使用/Oy),对于函数而言不设置其RBP意味着可以节省若干条指令。在函数内部则完全使用RSP的偏移来定位局部变量,包括嵌套作用域里的局部变量,即使程序实际运行时不会进入这个作用域。

例如:

[cpp] view plain copy

  1. void f2() {  
  2.     int a = 0x1234;  
  3.     if (a > 0) {  
  4.         int b = 0xff;  
  5.         b = a;  
  6.     }  
  7. }  

gcc中使用-fomit-frame-pointer生成的代码为:

[plain] view plain copy

  1. (gdb) disassemble f2  
  2. Dump of assembler code for function f2:  
  3. 0x00000000004004a5 <f2+0>:      movl   $0x1234,-0x8(%rsp)    # int a = 0x1234  
  4. 0x00000000004004ad <f2+8>:      cmpl   $0x0,-0x8(%rsp)         
  5. 0x00000000004004b2 <f2+13>:     jle    0x4004c4 <f2+31>        
  6. 0x00000000004004b4 <f2+15>:     movl   $0xff,-0x4(%rsp)      # int b = 0xff  
  7. 0x00000000004004bc <f2+23>:     mov    -0x8(%rsp),%eax  
  8. 0x00000000004004c0 <f2+27>:     mov    %eax,-0x4(%rsp)  
  9. 0x00000000004004c4 <f2+31>:     retq  

可以发现f2()没有操作RBP之类的指令了。

原文地址: http://codemacro.com/2014/09/02/stack-frame/
written by Kevin Lynx  posted at
http://codemacro.com

时间: 2024-10-27 07:17:12

C/C++中手动获取调用堆栈【转】的相关文章

C/C++中手动获取调用堆栈

C/C++中手动获取调用堆栈 当我们的程序core掉之后,如果能获取到core时的函数调用堆栈将非常有利于定位问题.在Windows下可以使用SEH机制:在Linux下通过gdb使用coredump文件即可. 但有时候由于某些错误导致堆栈被破坏,发生拿不到调用堆栈的情况. 一些基础预备知识本文不再详述,可以参考以下文章: 函数调用栈的获取原理分析 寄存器.函数调用与栈帧 需要知道的信息: 函数调用对应的call指令本质上是先压入下一条指令的地址到堆栈,然后跳转到目标函数地址 函数返回指令ret则

ASP.NET中实现获取调用方法名_实用技巧

本文实例讲述了ASP.NET中实现获取调用方法名的技巧.分享给大家供大家参考.具体实现方法如下: 在写记录日志功能时,需要记录日志调用方所在的模块名.命名空间名.类名以及方法名,想到使用的是反射(涉及到反射请注意性能),但具体是哪一块儿还不了解,于是搜索,整理如下:   需要添加相应的命名空间: 复制代码 代码如下: using System; using System.Diagnostics; using System.Reflection; 如果仅是获取当前方法名,可以使用如下代码: 复制代

ASP.NET中实现获取调用方法名

  需要添加相应的命名空间: 复制代码 代码如下: using System; using System.Diagnostics; using System.Reflection; 如果仅是获取当前方法名,可以使用如下代码: 复制代码 代码如下: public static void WriteSysLog(int level, string content) { MethodBase mb = MethodBase.GetCurrentMethod(); string systemModule

struts 2中如何通过action手动获取参数

struts2中action手动获取Session,jsp页面参数 1. ActionContext 在Struts2开发中,除了将请求参数自动设置到Action的字段中,我们往往也需要在Action里直接获取请求(Request)或会话(Session)的一些信息, 甚至需要直接对JavaServlet Http的请求(HttpServletRequest),响应(HttpServletResponse)操作. 我们需要在Action中取得request请求参数"username"的

C#中通过API调用获取文件图标

在C#中要获取各种文件的图标,可以通过API调用来完成.主要的函数是SHGetFileInfo.在C#中操作的方式如下 : 第一步:准备SHGetFileInfo需要的各种参数类型. 1.FileInfoStruct [StructLayout( LayoutKind.Sequential)] public struct FileInfoStruct ...{ public IntPtr hIcon; public int iIcon; public int dwAttributes; [ Ma

javascript-谷歌:CEF3中,c++调用JS的返回值获取问题?

问题描述 谷歌:CEF3中,c++调用JS的返回值获取问题? 谷歌:CEF3中,c++调用JS的返回值怎么获取?直接执行ExecuteJavascript获取不到返回值,请大神们指教!谢谢! 解决方案 不能用同步方式阻塞结果,而应该用异步方式 class CefV8AsyncResult{ void Success(CefRefPtr<CefV8Value> result void* user_data) =0; void Error(CefRefPtr<CefV8Value> e

Anroid 求解答代码中如何获取到抽象类的对象,从而调用抽象类中的方法。(急)

问题描述 Anroid 求解答代码中如何获取到抽象类的对象,从而调用抽象类中的方法.(急) public abstract class DataSource { protected static DataSource me; public static DataSource getInstance() { if (me == null) {} try { if (me == null) { //下面这一行代码在Application中是空实现 MyApplication.getInstance(

java-JAVA swing 怎么获取调用程序界面中的文本框,并向光标位置填写密码?

问题描述 JAVA swing 怎么获取调用程序界面中的文本框,并向光标位置填写密码? 然后用重定向输出的方法自动填写密码 解决方案 Java有直接可调用密码框方法啊.可以参考下面的代码. import java.awt.BorderLayout; import javax.swing.JFrame; import javax.swing.JLabel; import javax.swing.JPanel; import javax.swing.JPasswordField; import ja

探讨Smarty中如何获取数组的长度以及smarty调用php函数的详解_php技巧

Smarty中如何获取数组的长度 前提假设:分配了一个数组array给Smarty,假设Smarty的分界符为'{' 和'}'.在很多资料上都看到,在Smarty中要求数组的长度时,可以用在数组后便加|count的方法调用.即通过{array|count}获得array的长度.但是今天在写模板时,发现这样得不到数组的长度,而只是得到一个返回的字符串Array.也就是说仅仅是返回了{array}的结果,而没有返回其array的长度. 查看smarty\plugins文件夹,发现并没有count的相