汇编程序中, 对数据访问时, 通常是这样的:
_asm{
...
DATA_LABLE:
_emit 0x87
_emit 0xa0
_emit 0x49
_emit 0x90
...
mov ebx, dword ptr [DATA_LABLE]
...
}
其中, 当程序编译之后, mov指令中的DATA_LABLE标号地址会被转成一个绝对地址. 而有时绝对地址这一点可能会对这样一种需求带来障碍: 我们希望自己写的汇编代码不管被放在哪块地址空间中都是能正常运行的, 就象我们写高级语言中的那些函数一样, 函数位置可以被随意放置, 丝毫不会影响函数本身的功能使用. 当然, 不得不指出的是, 尽管要求的是同样功能, 但汇编与高级语言之间在这方面的实现却相去甚远. 高级语言的函数在最终被编译之后, 其函数地址也是固定的绝对地址, 而我们所想要用汇编实现的才是真正的"可被任意放置"的二进制执行块.
借用call指令, 可以实现运行期标号地址的相对寻址, 大致的思路如下:
_asm{
...
call FUNC_START
FUNC_START:
pop ebx
sub ebx, offset FUNC_START
mov [ebp-xx], ebx
...
DATA_LABLE:
_emit 0x87
_emit 0xa0
_emit 0x49
_emit 0x90
...
mov eax, [ebp-xx]
mov ebx, dword ptr [DATA_LABLE+eax]
...
}
步骤是这样的:
1.首先, 在汇编功能块或函数首部, 使用以下语句取得运行期地址与编译地址的修正差值.
call FUNC_START
FUNC_START:
pop ebx
sub ebx, offset FUNC_START
mov [ebp-xx], ebx
略作解释: call 函数会将eip寄存器压入堆栈, 之后用"pop ebp"是将eip值赋给ebp, 而eip表示的是"下一条语句的地址", 在这里, 当程序运行到"call FUNC_START"时, 它表示的是以标号"FUNC_START:"开始的"pop ebx"指令起始地址. 而另一方面, sub指令中的"offset FUNC_START", 在编译时, offset会被转成一个绝对地址. 这样,通过sub操作, 就获得了此段代码在编译期和运行期关于指令地址的修正值. 下面的这句: "mov [ebp-xx], ebx", 实际上只是锦上添花, 它把这个值保存在了某一个自定义的函数局部变量空间内, 以备后续语句方便引用.
2.相应的, 对标号数据的引用就变成这样的两句:
mov eax, [ebp-xx]
mov ebx, dword ptr [DATA_LABLE+eax]
对于汇编函数中的此类代码进行这样的处理后, 此段二进制执行块就可以被放置在任意地方而不致因为对DATA_LABLE数据地址的错误引用造成程序错误.