Win32环境下的程序崩溃异常定位

1       案例描述

作为Windows程序员,平时最担心见到的事情可能就是程序发生了崩溃(异常),这时Windows会提示该程序执行了非法操作,即将关闭。请与您的供应商联系。呵呵,这句微软的“名言”,恐怕是程序员最怕见也最常见的东西了。

在一个大型软件的测试过程中,初期出现程序崩溃似乎成了不可避免的事。其实测试中出现程序崩溃并不可怕,反而是测试的成功。作为开发的我们更需要关心的是程序中的哪个函数或哪一行导致了系统崩溃,这样才能有针对性的进行改正。

本文描述了自己总结的几种定位崩溃的办法。

 

 

2       案例分析

 

以下是几种常见的崩溃现象及对应的处理办法:

1.        对于Release版本必现的崩溃且在Debug版本上也崩溃的程序。

解决思路:去掉所有断点,直接在Debug版本上运行程序,在程序崩溃时,VC会自动跳转定位到崩溃代码行, 这种方法最简单也最常用。

2.        对于在Debug版本上不崩溃但Release版本崩溃的程序,很有可能是Debug和Release版本的差异。例如Debug版本所有成员在构造时会被清0,而Release版本所有成员在构造时是内存里面的原始值,而且Debug有运行时库做保护,这些都会导致某些程序在Debug正常而Release崩溃。

解决思路:1)在程序中加打印,通过程序崩溃之前的打印定位出错位置; 2)逐段注释代码,直到程序不崩溃为止。这种方法耗时较长,对程序员要求较高,而且对于那种不是必现的bug或者很难搭建执行环境的情况就较难处理了。

3.        对于在客户现场崩溃的情况,显然不适合直接带一台电脑去调试。

解决思路:应该有文件记录下崩溃信息,客服人员可以将崩溃信息文件发送给程序员,以便程序员查询崩溃原因,然后利用编译时生成MAP文件(工程信息文件,存放在版本编译机中)的信息来定位问题函数或问题代码行。下面就这种方法展开讨论一下:

 

 

3       解决过程

 

对于上节第三种情况,也是最难解决的情况,解决过程如下:

1.      崩溃回调注册,拦截Windows程序崩溃;

2.      在回调处理中,输出崩溃原因,崩溃内存地址,崩溃堆栈;

3.      工程输出map文件;

4.      通过崩溃内存地址以及map文件找出崩溃的函数。

5.      使用COD文件精确定位崩溃行

 

3.1     崩溃回调注册

 

实际上,只靠Windows的错误消息对话框提供的信息量是很有限的。用SetUnhandledExceptionFilter注册自定义错误处理回调函数,可以替换Win32默认的异常处理过滤器(top-level exception filter),而且能打印出崩溃堆栈,这对定位崩溃原因非常有用。

SetUnhandledExceptionFilter的函数原型:


LPTOP_LEVEL_EXCEPTION_FILTER SetUnhandledExceptionFilter(

LPTOP_LEVEL_EXCEPTION_FILTER lpTopLevelExceptionFilter ); 

功  能:注册和注销异常处理回调;

用  法:第一次调用注册异常处理回调,第二次调用注销;

返回值:返回当前的exception filter。需要保存这个函数指针,在注销异常处理回调的时候,以此为参数再次调用SetUnhandledExceptionFilter。打印异常处理也需要此值。

参数: 异常处理的回调函数;

 

 

3.2     输出崩溃信息

 

崩溃信息在异常回调函数中打印,输出到程序执行目录下的文件:

异常处理回调的函数原形:


LONG WINAPI CallBackDebugInfo ( EXCEPTION_POINTERS *pException); 

功  能:异常处理回调处理,打印崩溃信息;

用  法:注册自定义错误处理回调:SetUnhandledExceptionFilter (CallBackDebugInfo);

返回值:EXCEPTION_CONTINUE_EXECUTION –  错误已经被修复,从异常发生处继续执行

EXCEPTION_CONTINUE_SEARCH    –  继续查找异常过滤器

EXCEPTION_EXECUTE_HANDLER   –  正常返回

参数: 崩溃信息结构,包含崩溃原因、崩溃模块、崩溃地址、崩溃堆栈等;

常见崩溃原因有:

EXCEPTION_ACCESS_VIOLATION = C0000005h   读写内存错误

EXCEPTION_INT_DIVIDE_BY_ZERO = C0000094h  除0错误

EXCEPTION_STACK_OVERFLOW = C00000FDh  堆栈溢出或者越界

EXCEPTION_GUARD_PAGE = 80000001h 由Virtual Alloc建立起来的属性页冲突

EXCEPTION_NONCONTINUABLE_EXCEPTION = C0000025h不可持续异常,程序无法恢复执行,异常处理例程不应处理这个异常

EXCEPTION_INVALID_DISPOSITION = C0000026h在异常处理过程中系统使用的代码

EXCEPTION_BREAKPOINT = 80000003h  调试时中断(INT 3)

EXCEPTION_SINGLE_STEP = 80000004h  单步调试状态(INT 1)

 

3.3     输出map文件

 

map文件记录程序的全局符号、源文件和代码行号信息,是整个程序工程信息的静态文本。通过文本阅读工具如Ultra Edit或记事本就可以打开Map文件。

在 VC 中,打开“Project Settings”选项页,选择 C/C++ 选项卡,并在最下面的 Project Options 里面输入:/Zd ,然后选择 Link 选项卡,选中“Generate mapfile”复选框。并在最下面的 Project Options 里面输入:/mapinfo:lines,表示生成 map 文件时,加入行信息。

 

 

最后编译就可以生成 MAP 文件,可以在工程的Debug或Release目录下找到刚刚生成的MAP文件,文件名为“工程名.map”。

 

3.4     使用map文件找出崩溃函数

      通过上面的步骤,已经得到了 MAP 文件,那么我们该如何利用它呢?下面一步步演示使用MAP文件定位程序崩溃行的过程。

      1.我们先在代码中加入非法内存操作(最常见的异常)的代码:


BOOL CMainFrameDlg::OnInitDialog()

{

         ::SetProp(m_hWnd,AfxGetApp()->m_pszExeName, (HANDLE)1);

         s32 *p=NULL;

         *p= 123;

 

2.执行程序,程序在开始就异常,在异常打印文件中打印了如下信息:


======================== 崩溃信息 ==========================

崩溃时间: 2009/06/02 16:58:22

崩溃原因:非法内存操作

异常代码 = c0000005

异常地址 = 0x0045a76f

异常模块: E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

Section name: .text - offset(rva) : 0x0005976f

---------------------- Trips of Stack ----------------------

E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

name : pcmtver - location: 2bef

3.确定崩溃地址是:0x0005976f,在Map文件中定位函数:


0001:00059420 ?OnCreate@CMainFrameDlg@@IAEHPAUtagCREATESTRUCTA@@@Z 0045a420 f  MainFrameDlg.obj

 0001:00059460       ?SetTooltips@CMainFrameDlg@@AAEXXZ 0045a460 f   MainFrameDlg.obj

 0001:00059700       ?OnTranslate@CMainFrameDlg@@IAEJIJ@Z 0045a700 f   MainFrameDlg.obj

 0001:00059730       ?OnInitDialog@CMainFrameDlg@@MAEHXZ 0045a730 f   MainFrameDlg.obj

 0001:00059a10  ?OnSysCommand@CMainFrameDlg@@IAEXIJ@Z 0045aa10 f   MainFrameDlg.obj

 0001:00059c20       ?OnPaint@CMainFrameDlg@@IAEXXZ 0045ac20 f   MainFrameDlg.obj

根据00059730< 0005976f < 00059a10 ,确定是在CMainFrameDlg 的OnInitDialog函数中的某一行产生了异常。

3.5     使用map代码行定位崩溃行区间

 


Line numbers for .\Release\MainFrameDlg.obj(E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\source\MainFrameDlg.cpp) segment .text

   498 0001:00059647   499 0001:00059667   501 0001:0005966e   502 0001:000596af

   503 0001:000596ed   506 0001:00059700   507 0001:00059703   508 0001:00059708

   510 0001:0005970f   511 0001:00059720   512 0001:00059723   515 0001:00059730

   516 0001:0005974e   521 0001:0005976d   524 0001:0005977e   526 0001:0005978b

我们在map文件的代码行信息里查找不超过计算结果0x0005976f,但可以找最接近的数。发现是MainFrameDlg.cpp 文件中的:521 0001:0005976d,而程序实际崩溃行在519(注释行和空行也要计算在内),非常接近实际崩溃行了,考虑到程序实际执行的是汇编指令,我们可以在(516 ~524)行区间内寻找到实际崩溃行。

时间: 2024-12-31 12:14:02

Win32环境下的程序崩溃异常定位的相关文章

VC程序在Win32环境下动态链接库(DLL)编程原理_C 语言

本文详细讲述了VC程序在Win32环境下动态链接库(DLL)编程原理.分享给大家供大家参考.具体分析如下: 一般比较大的应用程序都由很多模块组成,这些模块分别完成相对独立的功能,它们彼此协作来完成整个软件系统的工作.其中可能存在一些模块的功能较为通用,在构造其它软件系统时仍会被使用.在构造软件系统时,如果将所有模块的源代码都静态编译到整个应用程序EXE文件中,会产生一些问题:一个缺点是增加了应用程序的大小,它会占用更多的磁盘空间,程序运行时也会消耗较大的内存空间,造成系统资源的浪费:另一个缺点是

c语言-“熟悉win32环境下编程”其中的win32环境下编程是不是就是c/c++那个编程环境啊?

问题描述 "熟悉win32环境下编程"其中的win32环境下编程是不是就是c/c++那个编程环境啊? 如题?"熟悉win32环境下编程"其中的win32环境下编程是不是就是c/c++那个编程环境啊?多谢 解决方案 字面意思很明白了,win32环境编程,首先是windows 其次是32位机,为什么要和c++关联起来呢? 解决方案二: C/C++可以写 Win32 的程序,也可以写 Linux 的程序.这里的 Win32,主要是指 Win32 API,如 windows

Win32环境下动态链接库(DLL)编程原理

比较大应用程序都由很多模块组成,这些模块分别完成相对独立的功能,它们彼此协作来完成整个软件系统的工作.其中可能存在一些模块的功能较为通用,在构造其它软件系统时仍会被使用.在构造软件系统时,如果将所有模块的源代码都静态编译到整个应用程序EXE文件中,会产生一些问题:一个缺点是增加了应用程序的大小,它会占用更多的磁盘空间,程序运行时也会消耗较大的内存空间,造成系统资源的浪费:另一个缺点是,在编写大的EXE程序时,在每次修改重建时都必须调整编译所有源代码,增加了编译过程的复杂性,也不利于阶段性的单元测

PB环境下分布式应用程序的开发

一.分布式应用程序概述 分布式系统的出现源于传统的C/S结构的若干弊病,如效率低,安全性差等,结合到数据库方面来说,全球的DNS(域名解析系统)系统是一个很典型的例子,试想如果把全世界所有的域名都集中到一台服务器中来进行管理,那服务器肯定会因负载过重而无法正常工作,整个互联网也就瘫痪了. 在编写C/S结构的数据库应用系统时,同样也会遇到这类问题,那就是如果客户数量很多,数据量又都很大的情况下,服务器的负载就会很重,而且重复性工作很多,因为很多客户发出的查询可能完全相同而服务器却需要一一进行查询:

公有云环境下应用程序的自动化部署与水平扩展问题

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://dgd2010.blog.51cto.com/1539422/1690176 先介绍了一下公有云计算环境下的一些特点,再根据这些特点探讨一下作为云计算用户而言,如何对应用程序做好自动化部署和水平扩展(弹性计算)的问题.阅读本文需要有一定的云计算知识.开发运维知识. 公有云环境的优势及其特点 公有云为企业用户或个人用户(以下统称为用户)可提供三种服务,基础服务.应用服务和运维服务.

在有VS的环境下,程序能正常运行,没有的情况下会报错(都有.net framework4.0环境),错误日志如下

问题描述 日志名称:Application来源:.NETRuntime日期:2/28/159:24:46PM事件ID:1026任务类别:无级别:错误关键字:经典用户:暂缺计算机:VICTORMBFF5描述:应用程序:GUIApplication.exeFramework版本:v4.0.30319说明:由于未经处理的异常,进程终止.异常信息:System.Windows.Markup.XamlParseException堆栈:在System.Windows.Markup.WpfXamlLoader

vc 环境下的程序 高配电脑不兼容

问题描述 在vc2003和vc2008下写的程序,在windowxp的不同配制的电脑上使用时,配制高点的电脑报错,主要是用new申请内存时报错,但在*.exe的属性中的兼容性中,把兼容模式勾选,并选用Windows2000时,问题临时解决了.不知道这是什么原因?有没有更好的解决方法? 解决方案 解决方案二:编译问题.注意编译选项

weblogic环境下,EJB调用异常,有知道解决办法的吗

问题描述 SessionBean:packagecom.test.ejb;importjavax.ejb.Stateless;@StatelesspublicclassHelloWorldimplementsHelloWorldLocal,HelloWorldRemote{publicHelloWorld(){}publicStringsayHello(Stringname){returnname+":lllll";}}客户端调用:packageejb.client;importjav

WEB环境下办公自动化文档修改痕迹保留的实现

web WEB环境下办公自动化文档修改痕迹保留的实现 一.痕迹保留的现状与思考 随着政府机关和许多企事业单位网络建设逐步完成,对于在如何利用网络,如何表现出网络的优势方面,用户最容易想到,同时也是最容易产生效果的应用,就是办公自动化系统(OA).在当前的软件开发实践中,B/S模式(浏览器/服务器模式)的开发可以采用三层结构,前端服务层.中间业务层.后台数据库.由于其扩展性好,数据安全性高,同时无须考虑客户端的兼容性,解决了C/S模式二层结构的诸多局限性,因而在办公自动化系统中得到了广泛的应用.