Linux Debugging(二): 熟悉AT&T汇编语言

    没想到《Linux Debugging:使用反汇编理解C++程序函数调用栈》发表了收到了大家的欢迎。但是有网友留言说不熟悉汇编,因此本书列了汇编的基础语法。这些对于我们平时的调试应该是够用了。

1 AT&T与Intel汇编语法对比

    本科时候大家学的基本上都是Intel的8086汇编语言,微软采用的就是这种格式的汇编。GCC采用的是AT&T的汇编格式, 也叫GAS格式(Gnu ASembler GNU汇编器)。

1、寄存器命名不同

AT&T Intel 说明
%eax eax Intel的不带百分号

2、操作数顺序不同

AT&T Intel 说明
movl %eax, %ebx mov ebx, eax Intel的目的操作数在前,源操作数在后;AT&T相反

3、常数/立即数的格式不同

AT&T Intel 说明
movl $_value,%ebx mov eax,_value Intel的立即数前面不带$符号
movl $0xd00d,%ebx mov ebx,0xd00d 规则同样适用于16进制的立即数

4、操作数长度标识

AT&T Intel 说明
movw %ax,%bx mov bx,ax Intel的汇编中, 操作数的长度并不通过指令符号来标识。
AT&T的格式中, 每个操作都有一个字符后缀, 表明操作数的大小. 例如:mov指令有三种形式:
movb  传送字节
movw  传送字
movl   传送双字
如果没有指定操作数长度的话,编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”,由于目标操作数bx的长度为word,那么编译器将把此指令等同于“movw %ax, %bx”。

5、寻址方式

AT&T Intel 说明
imm32(basepointer,
indexpointer,
indexscale)
[basepointer + indexpointer*indexscale + imm32)
两种寻址的实际结果都应该是

imm32 + basepointer + indexpointer*indexscale

例如: 下面是一些寻址的例子:

AT&T Intel 说明
mov 4(%ebp), %eax mov eax, [ebp + 4] 基址寻址(Base Pointer Addressing Mode),用于访问结构体成员比较方便,例如一个结构体的基地址保存在eax寄存器中,其中一个成员在结构体内的偏移量是4字节,要把这个成员读上来就可以用这条指令
data_items(,%edi,4) [data_items+edi*4 变址寻址(Indexed Addressing Mode),访问数组
movl $addr, %eax mov eax, addr 直接寻址(Direct Addressing Mode)
movl (%eax), %ebx mov ebx, [eax] 间接寻址(Indirect Addressing Mode),把eax寄存器的值看作地址,把内存中这个地址处的32位数传送到ebx寄存器

mov $12, %eax

mov eax, 12 立即数寻址(Immediate Mode)
mov $12, %eax mov eax, 12 寄存器寻址(Register Addressing Mode

6.跳转方式不同

AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。 

AT&T Intel 说明
jmp *%eax jmp %eax 用寄存器%eax中的值作为跳转目标
jmp *(%eax) jmp (%eax) 以%eax中的值作为读入的地址, 从存储器中读出跳转目标

2 求一个数组最大数

通过求一个数组的最大数,来进一步学习AT&T的语法

[cpp] view plaincopy

  1. #PURPOSE: This program finds the maximum number of a  
  2. #     set of data items.  
  3. #  
  4. #VARIABLES: The registers have the following uses:  
  5. #  
  6. # %edi - Holds the index of the data item being examined  
  7. # %ebx - Largest data item found  
  8. # %eax - Current data item  
  9. #  
  10. # The following memory locations are used:  
  11. #  
  12. # data_items - contains the item data. A 0 is used  
  13. # to terminate the data  
  14. #  
  15.  .section .data #全局变量  
  16. data_items:         #These are the data items  
  17.  .long 3,67,34,222,45,75,54,34,44,33,22,11,66,0  
  18.   
  19.  .section .text  
  20.  .globl _start  
  21. _start:  
  22.  movl $0, %edi      # move 0 into the index register  
  23.  movl data_items(,%edi,4), %eax # load the first byte of data  
  24.  movl %eax, %ebx    # since this is the first item, %eax is  
  25.             # the biggest  
  26.   
  27. start_loop:         # start loop  
  28.  cmpl $0, %eax      # check to see if we've hit the end  
  29.  je loop_exit  
  30.  incl %edi      # load next value  
  31.  movl data_items(,%edi,4), %eax  
  32.  cmpl %ebx, %eax    # compare values  
  33.  jle start_loop     # jump to loop beginning if the new  
  34.             # one isn't bigger  
  35.  movl %eax, %ebx    # move the value as the largest  
  36.  jmp start_loop     # jump to loop beginning  
  37.   
  38. loop_exit:  
  39.  # %ebx is the status code for the _exit system call  
  40.  # and it already has the maximum number  
  41.  movl $1, %eax      #1 is the _exit() syscall  
  42.  int $0x80  

汇编程序中以.开头的名称并不是指令的助记符,不会被翻译成机器指令,而是给汇编器一些特殊指示,称为汇编指示(Assembler Directive)或伪操作(Pseudo-operation),由于它不是真正的指令所以加个“伪”字。.section指示把代码划分成若干个段(Section),程序被操作系统加载执行时,每个段被加载到不同的地址,操作系统对不同的页面设置不同的读、写、执行权限。.data段保存程序的数据,是可读可写的,相当于C++程序的全局变量。

.text段保存代码,是只读和可执行的,后面那些指令都属于.text段。

.long指示声明一组数,每个数占32;.quad类似,占64位;.byte是8位;.word 是16位。.ascii,例如.ascii "Hello world",声明11个数,取值为相应字符的ASCII码。

参考资料:

1.  最简单的汇编程序

2. 第二个汇编程序

3. http://blog.chinaunix.net/uid-27717694-id-3942757.html

最后复习一下lea命令:

mov 4(%ebp) %eax #将%ebp+4地址处所存的值,mov到%eax

leal 4(%ebp) %eax #将%ebp+4的地址值, mov到%eax

leal 可以被mov取代:

addl $4, %ebp

mov. %ebp, %eax

时间: 2024-10-04 16:37:07

Linux Debugging(二): 熟悉AT&T汇编语言的相关文章

Linux Debugging(三): C++函数调用的参数传递方法总结(通过gdb+反汇编)

         上一篇文章<Linux Debugging:使用反汇编理解C++程序函数调用栈>没想到能得到那么多人的喜爱,因为那篇文章是以32位的C++普通函数(非类成员函数)为例子写的,因此只是一个特殊的例子.本文将函数调用时的参数传递方法进行一下总结.总结将为C++普通函数.类成员函数:32位和64位进行总结.         建议还是读一下Linux Debugging:使用反汇编理解C++程序函数调用栈,这样本文的结论将非常容易理解,将非常好的为CoreDump分析开一个好头.而且

Linux Debugging(五): coredump 分析入门

        作为工作几年的老程序猿,肯定会遇到coredump,log severity设置的比较高,导致可用的log无法分析问题所在. 更悲剧的是,这个问题不好复现!所以现在你手头唯一的线索就是这个程序的尸体:coredump.你不得不通过它,来寻找问题根源.       通过上几篇文章,我们知道了函数参数是如何传递的,和函数调用时栈是如何变化的:当然了还有AT&T的汇编基础,这些,已经可以使我们具备了一定的调试基础.其实,很多调试还是需要经验+感觉的.当然说这句话可能会被打.但是你不得不

linux实验二

实验2 Linux文件系统 一.实验目的 通过实验掌握Linux中文件管理的基本概念,包括常用命令格式.文件类型.目录结构等,初步了解有关文件安全方面的知识..   二.实验内容1.使用pwd,cd,ls等命令浏览文件系统.2.使用cat,cp,mv,head,tail,rm等命令查看和操作文件.3.使用find,grep命令进行文件查找和模式匹配.4.使用chmod命令修改文件的权限.   三.         实验报告 1.              简要说明实验的目的.任务与设备 2.  

Linux Debugging(四): 使用GDB来理解C++ 对象的内存布局(多重继承,虚继承)

      前一段时间再次拜读<Inside the C++ Object Model> 深入探索C++对象模型,有了进一步的理解,因此我也写了四篇博文算是读书笔记: Program Transformation Semantics (程序转换语义学) The Semantics of Copy Constructors(拷贝构造函数之编译背后的行为) The Semantics of Constructors: The Default Constructor (默认构造函数什么时候会被创建出

Linux Debugging(七): 使用反汇编理解动态库函数调用方式GOT/PLT

     本文主要讲解动态库函数的地址是如何在运行时被定位的.首先介绍一下PIC和Relocatable的动态库的区别.然后讲解一下GOT和PLT的理论知识.GOT是Global Offset Table,是保存库函数地址的区域.程序运行时,库函数的地址会设置到GOT中.由于动态库的函数是在使用时才被加载,因此刚开始GOT表是空的.地址的设置就涉及到了PLT,Procedure Linkage Table,它包含了一些代码以调用库函数,它可以被理解成一系列的小函数,这些小函数的数量其实就是库函数

Linux进程间通信(二) 管道通信之无名管道及其基础实验

管道简介 管道是Linux中进程间通信的一种方式,它把一个程序的输出直接连接到另一个程序的输 入(其实我更愿意将管道比喻为农村浇地的管子).Linux的管道主要包括两种:无名管道和有名管道.这一节 主要讲无名管道,首先介绍一下这两个管道.(特点很重要啊!) 1.无名管道 无名管道是 Linux中管道通信的一种原始方法,如图一(左)所示,它具有以下特点: ①  它只能用于具有亲 缘关系的进程之间的通信(也就是父子进程或者兄弟进程之间): ②  它是一个半双工的通信模 式,具有固定的读端和写端: ③

Linux Debugging(六): 动态库注入、ltrace、strace、Valgrind

实际上,Linux的调试方法非常多,针对不同的问题,不同的场景,不同的应用,都有不同的方法.很难去概括.本篇文章主要涉及本专栏还没有涵盖,但是的确有很重要的方法.本文主要包括动态库注入调试:使用ltrace命令处理动态库的调试:使用strace调试系统调用的问题:Valgrind的简要介绍. 1. 动态库注入       如何排除其他library的调用问题?动态库注入(library injection)有可能会让你事半功倍. 一个大型的软件系统,会用到非常多的动态库.那么如果该动态库的一个a

Linux文件共享(二)——两个独立进程打开同一个文件

如果两个独立进程各自打开了同一文件,则有图3-2中所示的安排.我们假定第一个进程使该文件在文件描述符3上打开,而另一个进程则使此文件在文件描述符4上打开.打开此文件的每一个进程都得到一个文件对象,但对一个给定的文件只有一个v节点表项.每个进程都有自己的文件对象的一个理由:这种安排使每个进程都有它自己对该文件的当前位移量.这种情况不会增加对应的打开文件引用计数,而会增加dentry的引用.          给出了这些数据结构后,现在对前面所述的操作作进一步说明. (1) 在完成每一个write后

新手学Linux(二)----使用 Vagrant 打造跨平台开发环境(一)

前言 什么是Vagrant Vagrant能做什么 尽可能避免Work on my machine错误 缩短搭建开发环境的时间 Vagrant的主要使用者 前言     做Web开发少不了要在本地搭建好开发环境,虽然说目前各种脚本都有对应的Windows版,甚至是一键安装包,但很多时候和Windows环境的相性并不是那么好,各麻烦的问题是实际部署的环境通常是Linux,常常还要面临着开发和部署环境不一致,上线前还要大量的调试.更要命的是,如果有很多机器需要装的话,那就真是一个灾难了. 什么是Va