今天在学习汇编的时候遇到一个程序,如下:
assume cs:codesg codesg segment mov ax,4c00h int 21h start: mov ax,0 s: nop nop mov di,offset s mov si,offset s2 mov ax,cs:[si] mov cs:[di],ax s0: jmp short s s1: mov ax,0 int 21h mov ax,0 s2: jmp short s1 nop codesg ends end start
问执行这段汇编代码后程序可以正常返回么?
乍看下,寄存器di
和si
中分别存储标号s和s2的偏移地址,然后把代码 jmp short s1
拷贝到标号s处,然后程序跳转到s1处执行,很明显,这样执行,是无法执行到 mov ax,4c00h
处的,也就无法正常返回,但是在debug后,发现竟然可以正常返回,执行结果见下图:
可以看到代码 jmp short s1
被编译器解析成了 jmp 0000h
,也就是跳转到 mov ax,4c00h
处执行,程序最终正常返回,首先来看编译之后的代码:
从上图发现 jmp short s1
被解析为 jmp 0018
, 为什么同样一句代码有两种不同的解析结果呢?查阅书籍后,找到了前后不同解析的原因,都是因为jmp执行跳转的时候行为方式决定的。
从上面的debug程序中,可以看到 jmp short s1
解析之后的机器码为 EBF6
,而它跳转至的偏移地址为 0018h,可以发现机器码中并没有包含跳转后的内存地址,jmp指令为了方便程序在内存中的浮动装配,是根据转移目的地址和转移起始地址之间的相对位移来进行转移的。即:
IP = IP + 位移长度,位移长度 = 跳转目的地址 - 短跳转指令的下一条指令地址,位移范围在 -128~127 之间。
来看 jmp short s1
的机器码:
EBF6
这里的EB
是jmp编译之后得到的机器码,F6
则是-10的补码,IP向前移动10个字节的长度,第二张图片红框部分即从0b3b:0022
跳转到0b3b:0018
的位置。在将 jmp short s1
拷贝到标号s处的时候,拷贝的是机器码,即将EBF6拷贝到了标号s处,而机器码EBF6的含义就是将IP向前移动10个字节的位置,而向前移动10个字节后这时IP又恰好指向了代码 mov ax,4c00h
,所以代码就顺利退出了。
总结发现,这个程序的关键在于指令 jmp short 标号
不是根据绝对地址进行转移而是通过相对位移进行转移的,这样也使得程序在不同内存段中可以正常执行。
转载请注明: Jinkun 的博客 » x86汇编中jmp指令底层执行解析