跟随Android进入ARM v8a的世界(1) - 从例子说起

跟随Android进入ARM v8a的世界

从例子说起

目前我们在Android上运行的ARM芯片,有6套指令集,32位的ARM v5指令集,16位的thumb指令集,32位的ARM v7a指令集,16位和32位混合的thumb2指令集,32位的ARM v7a带Neon的指令集,还有64位的ARM v8a指令集。
16位的Thumb指令集是个不完备的指令集,需要跟ARM指令混编才可以完成全部的功能。

我们先向经典致敬,看看求最大公约数的代码。

C代码是这样的:

unsigned int gcd(unsigned int a, unsigned int b){
    while(a!=b){
        if(a>b){
            a-=b;
        }else{
            b-=a;
        }
    }
    return a;
}

手工写出来的汇编是这样的:

.global gcd_asm
.func gcd_asm

gcd_asm:
    cmp r0,r1
    subgt r0,r0,r1
    sublt r1,r1,r0
    bne gcd_asm
    bx lr
.endfunc
.end

解释一下上面用到的指令:
cmp r0, r1:做一次r0-r1的减法,根据结果设置CPSR的值。如果r0-r1为0,那么将CPSR中表示为0的Z位置1,否则置0. 如果r0-r1>0,则将表示负数的N位l置0,如果r0-r1<0,则该位置1.
SUB是减法指令,GT和LT是条件执行指令。
SUBGT是在GT,即大于或等于的条件下执行该减法,同理,SUBLT是在小于或等于的情况下执行该减法。
BNE是在Z标志未置的情况下跳转。
BX是切换跳转,用于函数返回。

下面来看看gcc为我们编出了什么样的汇编代码。
ARM v5的ARM模式的指令是这样的:

00000fd8 <gcd>:
     fd8:   e1500001    cmp r0, r1
     fdc:   012fff1e    bxeq    lr
     fe0:   e1500001    cmp r0, r1
     fe4:   80610000    rsbhi   r0, r1, r0
     fe8:   90601001    rsbls   r1, r0, r1
     fec:   e1510000    cmp r1, r0
     ff0:   1afffffa    bne fe0 <gcd+0x8>
     ff4:   e12fff1e    bx  lr

可以看到,每条指令都32位长度。
BXEQ LR,上节介绍过BX了,EQ是条件执行。如果r0和r1相等则返回。
然后再做一次cmp。
RSB是反向的减法,RSB a b c,相当于a= c-b。而SUB a b c相当于a = b – c
HI是无符号数的大于,LS是无符号数的小于。
所以RSBHI和RSBLS跟之前的SUBGT和SUBLT本质上没有区别。
BNE和BX跟之前一样,就不多解释了。

ARM v7a的ARM模式的指令是这样的:

00000c7c <gcd>:
     c7c:   e1500001    cmp r0, r1
     c80:   012fff1e    bxeq    lr
     c84:   e1500001    cmp r0, r1
     c88:   80610000    rsbhi   r0, r1, r0
     c8c:   90601001    rsbls   r1, r0, r1
     c90:   e1510000    cmp r1, r0
     c94:   1afffffa    bne c84 <gcd+0x8>
     c98:   e12fff1e    bx  lr

由于逻辑太简单了,发挥不出ARM v7a指令集的优势,所以跟ARM v5是一样的。

Thumb指令是这样的:

00000fd0 <gcd>:
     fd0:   b500        push    {lr}
     fd2:   4288        cmp r0, r1
     fd4:   d004        beq.n   fe0 <gcd+0x10>
     fd6:   d901        bls.n   fdc <gcd+0xc>
     fd8:   1a40        subs    r0, r0, r1
     fda:   e7fa        b.n fd2 <gcd+0x2>
     fdc:   1a09        subs    r1, r1, r0
     fde:   e7f8        b.n fd2 <gcd+0x2>
     fe0:   bd00        pop {pc}

可以看到,指令是全16位的。
由于16位长指令的限制,SUB指令再做不了条件了,所以需要额外的比较和跳转指令。
Thumb2指令是这样的:

00000c6c <gcd>:
     c6c:   4288        cmp r0, r1
     c6e:   d005        beq.n   c7c <gcd+0x10>
     c70:   bf8c        ite hi
     c72:   ebc1 0000   rsbhi   r0, r1, r0
     c76:   ebc0 0101   rsbls   r1, r0, r1
     c7a:   e7f7        b.n c6c <gcd>
     c7c:   4770        bx  lr

可以看到,是16位和32位混排的。
比较,跳转之类的还是16位指令,减法又把ARM32指令搬出来了。

最后,ARM64 v8-a出马了。先看看手写的是什么样的:

.global gcd_asm
.func gcd_asm

gcd_asm:
    subs w2, w0, w1
    csel w0, w2, w0, gt
    csneg w1, w1, w2, gt
    bne gcd_asm
    ret
.endfunc
.end

csel根据后面的条件决定如何赋值,如果是GT,则w0=w2,否则w0 = w0。
Csneg在csel的基础上,如果条件不符合的话,取第三个参数的反。
Csneg w1, w1, w2, gt相当于,如果是GT,则w1=w1,否则w1=-w2。

注意,虽然操作数变成64位了,指令长度还是32位的哈。

0000000000000504 <gcd>:
 504:   6b01001f    cmp w0, w1
 508:   2a0003e2    mov w2, w0
 50c:   54000140    b.eq    534 <gcd+0x30>
 510:   6b01005f    cmp w2, w1
 514:   4b010040    sub w0, w2, w1
 518:   1a828000    csel    w0, w0, w2, hi
 51c:   4b020023    sub w3, w1, w2
 520:   6b01005f    cmp w2, w1
 524:   2a0003e2    mov w2, w0
 528:   1a838021    csel    w1, w1, w3, hi
 52c:   6b00003f    cmp w1, w0
 530:   54ffff01    b.ne    510 <gcd+0xc>
 534:   d65f03c0    ret
时间: 2024-11-18 11:37:00

跟随Android进入ARM v8a的世界(1) - 从例子说起的相关文章

android应用开发详解里的一个例子

问题描述 android应用开发详解里的一个例子 我导入的书上例子可以运行,照着书打进去的代码就不能运行,同样从例子里面复制过来的代码也不能运行,MainActivity可以显示,但是点击register后跳转的ResultActivity就不能显示,模拟器弹出has stopped字样,求解答 以下是代码 package com.amaker.test; import android.app.Activity; import android.content.Intent; import and

android策略设计模式-android中策咯设计模式谁给我个例子?

问题描述 android中策咯设计模式谁给我个例子? 就要一个例子,因为最近用到设备做刷卡操作,所以想看下策略设计模式. 解决方案 http://ifeve.com/java-example-of-strategy-pattern/ 解决方案二: 其实看java的策略模式就好了 参考这个,很详细:http://www.cnblogs.com/syxchina/archive/2011/10/11/2207017.html

Android Service和广播联合更新UI的例子

在Android中,异步更新UI,通常我们会选用Handler启动线程,或者sendMessage的方式,那么利用Service和广播也可以更新UI的,例子如下:我们建立一个Service: package com.andy import android.app.Service;//引入相关包 import android.content.BroadcastReceiver;//引入相关包 import android.content.Context;//引入相关包 import android

Android动态设置RelativeLayout控件的高度例子

在做项目的时候其中一个需求是要求banner图的宽和高是1:1所以我需要获取手机屏幕的宽度然后动态的把高度值设置为手机屏幕宽度的值在这项目中就是设置RelativeLayout的高度值代码如下 mRllayoutBanner = (RelativeLayout) findViewById(R.id.rl_banner); WindowManager wm = this.getWindowManager(); int width = wm.getDefaultDisplay().getWidth(

Android自定义View加载gif图片的例子

申明:本博客无图无真相,但是我亲测可以加载出来,假设出现只能加载一帧的情况,请在布局中加:  代码如下 复制代码 android:layerType="software"  下面是自定义View的代码:    代码如下 复制代码 package cn.zmit.foot.listviewfoot;   import android.annotation.SuppressLint; import android.content.Context; import android.graphi

ART世界探险(3) - ARM 64位CPU的架构快餐教程

ART世界探险(3) - ARM 64位CPU的架构快餐教程 前面我们说过,Dalvik如果没有JIT的话,可以做到架构无关,让Dalvik指令都解释执行.但是ART是AOT,要编译成针对芯片具体的机器指令. 所以,研究Dalvik的时候可以不用太关心目标指令,而我们研究ART必须对目前最流行的微处理器的架构有个基本的了解. 在上一讲我们对于ART从java byte code到ARM64 v8指令的整个流程有了一个大概的了解之后,我们就目前最流行的ARM64位芯片的知识进行一些探索. 我们的目

Android如何在三年时间里征服移动世界的

摩托罗拉Droid手机的出现被大多数人认为是Google在移动市场上的转折点 人们很容易会忘记,其实并不是很久以前,还没有人相信Android和我们的生活会有多大关系. 毕竟,Android的市场爆发也仅仅是在过去的一年里才真正开始的,大概也就是2007年秋天它的首次露面后的两年后.根据ChangeWave公司调查报告,今年一月以来,Android在移动操作系统上的市场份额已经翻了一翻,截止到2010年第三季度,所有销售的智能手机中高达44%的设备是使用的Android系统.Gartner调查公

ART世界探险(6) - 流程控制指令

ART世界探险(6) - 流程控制指令 分支结构 Java分支结构 我们先来个最简单的,比较大小吧. public static long bigger(long a, long b){ if(a>=b){ return a; }else{ return b; } } public static int less(int a,int b){ if(a<=b){ return a; }else{ return b; } } 看看Java字节码是个什么样子: public static long

ART世界探险(5) - 计算指令

ART世界探险(5) - 计算指令 整数运算 Java的整型运算 我们先看看JVM是如何处理这些基本整数运算的吧. public static long add(long a, long b){ return a+b; } public static long sub(long a,long b){ return a-b; } public static long mul(long a, long b){ return a*b; } public static long div(long a,l