Java字节码修改框架ASM

字节码相对Java的意义类似汇编相对C的意义,底层了解的越多越深入,程序就越神奇,一切想法皆有可能实现。学习了下字节码框架ASM,总结分享下:

API概述。

一、ASM库提供了两类API接口模型来产生或者修改类字节码:

(1)核心API: 基于事件,每个事件代表类的一个元素,如头事件、方法事件、字段事件等。特点是更快耗费更少的内存。
(2)树型API: 基于对象树状结构,字段方法等都可以看做对象树的一部分。使用相对简单,但耗费内存。

二、API包结构大致如下:

(1)事件、解析器、生产器类API在包路径org.objectweb.asm及org.objectweb.asm.signature内。
(2)开发和调试中可以用到的一些核心API在包路径org.objectweb.asm.util内。
(3)基于对象树的API在org.objectweb.asm.tree内,同时包括了和事件类API互相转换的工具。
(4)org.objectweb.asm.tree.analysis为对象树类API提供了类分析框架。

核心类AP I- class

一、类结构
(1)虚拟机内部定义的类结构图:

(2)类名称在虚拟机内部标示有所不同,如java.lang.String内部标示为java/lang/String
(3)编译后的class的字段类型如下:

(4)方法描述内部标识如下:

二、类相关接口API:

(1)ClassReader可以看作事件的产生器,能够读取解析类的二进制字节数组,边解析边把类的字段或者方法等信息以事件传递给ClassVisitor的相关visitXXX方法。常见代码:

// ClassPrinter是ClassVisitor的实例,在内部的visitXXX方法内部定义自己的业务逻辑,如打印输出

ClassPrinter cp = new ClassPrinter();

ClassReader cr = new ClassReader("java.lang.Runnable");

cr.accept(cp, 0);

(2)ClassWriter可以看做时间的一个消费器,是ClassVisitor的一个子类实现,可以直接构建出类的二进制数组标识形式,截取下例子:

ClassWriter cw = new ClassWriter(0);

// public interface Comparable extends Mesurable {

cw.visit(V1_5, ACC_PUBLIC + ACC_ABSTRACT + ACC_INTERFACE,

"pkg/Comparable", null, "java/lang/Object",

new String[] { "pkg/Mesurable" });

// int LESS = -1;

cw.visitField(ACC_PUBLIC + ACC_FINAL + ACC_STATIC, "LESS", "I",

null, new Integer(-1)).visitEnd();

// int EQUAL = 0;

cw.visitField(ACC_PUBLIC + ACC_FINAL + ACC_STATIC, "EQUAL", "I",

null, new Integer(0)).visitEnd();

// int GREATER = 1;

cw.visitField(ACC_PUBLIC + ACC_FINAL + ACC_STATIC, "GREATER", "I",

null, new Integer(1)).visitEnd();

// int compareTo(Object o);

cw.visitMethod(ACC_PUBLIC + ACC_ABSTRACT, "compareTo",

"(Ljava/lang/Object;)I", null, null).visitEnd();

cw.visitEnd();

byte[] b = cw.toByteArray();

(3)ClassVisitor可以将接收到的所有监听到事件的方法调用传递给另外一个ClassVisitor,可以看做一个事件过滤器,针对ClassVisitor添加自己的业务逻辑就可以实现神奇的字节码修改:

// 转换前的字节码

byte[] b1 = ...;

ClassReader cr = new ClassReader(b);

ClassWriter cw = new ClassWriter(cr, 0);

// 在这里面定义你想要的业务,一切皆有可能

ClassVisitor cv = new ChangeVersionAdapter(cw);

cr.accept(cv, 0);

// 转换后的字节码

byte[] b2 = cw.toByteArray();

(4)ClassVisitor内可以实现删除类成员(如visitMethod返回null删除方法)、添加类成员(visitEnd添加visitField),ClassVisitor也可以是个调用链。

三、开发工具API:

(1)Type提供了内部类型和java类型的转换,如前面提到的String转换内部类名可以这样实现:

// 仅用于类或者接口,java/lang/String

String internalName = Type.getType(String.class).getInternalName();

String转换为内部描述可以这样:

// 转换内部描述:Ljava/lang/String;

String internalDesc = Type.getType(String.class).getDescriptor();

String intDesc = Type.INT_TYPE.getDescriptor();

方法参数和返回值示例:

// 返回Type.INT_TYPE

Type.getArgumentTypes("(I)V");

// Type.VOID_TYPE

Type.getReturnType("(I)V")

(2)TraceClassVisitor可以文本形式打印出转换后的字节码到底是什么样子的:

ClassWriter cw = new ClassWriter(0);

// printWriter会输出转换后的字节码

TraceClassVisitor cv = new TraceClassVisitor(cw, printWriter);

cv.visit(...);

...

cv.visitEnd();

byte b[] = cw.toByteArray();

(3)转换后的字节码是否格式合法可以用CheckClassAdapter校验:

ClassWriter cw = new ClassWriter(0);

TraceClassVisitor tcv = new TraceClassVisitor(cw, printWriter);

// 发现问题会抛出异常

CheckClassAdapter cv = new CheckClassAdapter(tcv);

cv.visit(...);

...

cv.visitEnd();

byte b[] = cw.toByteArray();

(4)如果有的类实在复杂到你很难写出字节码来生成它,ASM提供自动把复杂类打印出字节码的工具ASMifier,通过命令行方式输出,太强大了:

java -classpath asm.jar:asm-util.jar \

org.objectweb.asm.util.ASMifier \

java.lang.Runnable

核心类AP I- method

一、方法结构

(1)方法执行模型:Java代码在线程内执行,每个线程有自己响应的栈stack,每个栈由栈帧frame构成,每个frame代表一个方法调用。每个frame包括本地变量和操作栈,本地变量用序号访问,变量使用slot存储,除了long和double需要2个slot外其他变量都有一个slot存储。一个frame构成如下:

(2)字节码指令由操作码和参数构成,可以分为两类:一类是将值在本地变量和操作数栈来回复制移动的,如ILOAD\LLOAD\FLOAD\DLOAD\ALOAD\ISTORE\LSTORE\FSTORE等。另一类是操作操作数栈上value的,包括一大批的指令,操作栈stack的、定义常量的、算术计算的、类型转换的、操作类、操作字段、操作方法、操作数组、跳转、返回。

二、方法接口API和组件

(1)MethodVisitor可以被ClassVisitor的visitMethod方法返回,用于方法的生成和转化。MethodVisitor的内部方法严格按照如下顺序调用:

多个MethodVisitor时,每个都是一个独立的转换方法实例,因此多个MethodVisitor之间可以交替执行。类似类API,MethodVisitor使用到ClassReader和ClassWriter。ClassWriter参数不同意义不同:

// ASM不进行任何自动计算,需要我们自己计算栈帧、本地变量、操作数栈的大小

new ClassWriter(0);

(2)一个生产getF()方法的指令如下:

mv.visitCode();

mv.visitVarInsn(ALOAD, 0);

mv.visitFieldInsn(GETFIELD, "pkg/Bean", "f", "I");

mv.visitInsn(IRETURN);

mv.visitMaxs(1, 1);

mv.visitEnd();

(3)MethodVisitor和ClassVisitor通常配合使用来转换方法,可以用于删除方法指令、执行状态无关的转换、执行状态相关的转换(一般需要定义状态属性到MethodVisitor内记忆)及其他更复杂的转换。

三、方法开发工具API

(1)基本的Type、TraceClassVisitor、CheckClassAdapter、ASMifier同样适用。
(2)AnalyzerAdapter记录了visitFrame调用后栈帧映射的信息,必须要和ClassReader#EXPAND_FRAMES配合使用。每个visitX指令都被代理到调用链,并通过本地变量locals和栈stack模拟出队栈帧映射的影响,这样后面的visitor可以得到栈帧映射的当前状态。
(3)LocalVariablesSorter可以对方法内的变量自动编号,对于需要修改字节码添加变量的场景非常适用。还可以喝AnalyzerAdapter配合构造成过滤链配合使用。
(4)需要在方法开始和结束为止添加指令的场景适合使用AdviceAdapter,而且使用与构造方法。

 

时间: 2025-01-09 12:47:12

Java字节码修改框架ASM的相关文章

关于java字节码框架ASM的学习

一.什么是ASM ASM是一个java字节码操纵框架,它能被用来动态生成类或者增强既有类的功能.ASM 可以直接产生二进制 class 文件,也可以在类被加载入 Java 虚拟机之前动态改变类行为.Java class 被存储在严格格式定义的 .class文件里,这些类文件拥有足够的元数据来解析类中的所有元素:类名称.方法.属性以及 Java 字节码(指令).ASM从类文件中读入信息后,能够改变类行为,分析类信息,甚至能够根据用户要求生成新类. 使用ASM框架需要导入asm的jar包,下载链接:

使用ASM操作Java字节码,实现AOP原理

本文通过一个的例子来实现:使用ASM动态生成Java字节码文件(.class) 或者 加载字节码后动态修改字节码,添加我们需要执行的代码,来模拟实现Spring AOP. 年底了,也没心情抠字了,把写demo包含的几个类代码直接贴出来吧,代码拷贝下来后可以直接使用,不会有什么其他错误. 使用 asm-5.0.3.jar demo工程的package为com.shanhy.demo.asm.hello 5个Java文件: AopClassAdapter.java 用来处理哪些方法需要进行修改 Ao

什么时候我们需要修改java字节码

问题描述 spring,hibernate都有用到cglib, javassist来修改java字节码但是我不是很清楚为什么要这样做?以及他们是怎么做到的是在运行时还是编译时修改的?他们怎么确保修改后的语义是正确的呢 解决方案 javassist没有用过,说说cglib在AOP中,Java原生自带的模式需要依赖于接口,但是一些实现里面,是通过继承来实现的,压根就没有接口,或者只有很底层的接口.这种场景下,就没办法通过接口的这种动态代理方式来实现动作拦截.所以只好依赖于cglib.当然,最优雅的还

掌握Java字节码(转)

Java是一门设计为运行于虚拟机之上的编程语言,因此它需要一次编译,处处运行(当然也是一次编写,处处测试).因此,安装到你系统上的JVM是原生的程序,而运行在它之上的代码是平台无关的.Java字节码就是你写的源代码的中间表现形式,也就是你的代码编译后的产物.你的class文件就是字节码. 简单点说,字节码就是JVM使用的代码集,它在运行时可能会被JIT编译器编译成本地代码. 你玩过汇编语言或者机器代码吗?字节码就是类似的东西,不过业界中许多人也很少会用及它,因为基本没这个必要.然而它对于理解程序

Java字节码(.class文件)格式详解(一)

小介:去年在读<深入解析JVM>的时候写的,记得当时还想着用自己的代码解析字节码的,最后只完成了一部分.现在都不知道还有没有保留着,貌似Apache有现成的BCEL工程可以做这件事.当时也只是为了学习.这份资料主要参考<深入解析JVM>和<Java虚拟机规范>貌似是1.2版本的,整理出来的.里面包含了一些自己的理解和用实际代码的测试.有兴趣的童鞋可以研究研究.嘿嘿.要有错误也希望能为小弟指点出来,感激不尽.:) 1.总体格式 Class File format type

Java字节码(.class文件)格式详解(三)

2.11 在ClassFile.method_info.field_info中同时存在的Attribute 2.11.1     Synthetic Attribute Synthetic Attribute用于指示当前类.接口.方法或字段由编译器生成,而不在源代码中存在(不包含类初始函数和实例初始函数).相同的功能还有一种方式就是在类.接口.方法或字段的访问权限中设置ACC_SYNTHETIC标记.   Synthetic Attribute由JDK1.1中引入,以支持内嵌类和接口(neste

通过Java字节码发现有趣的内幕之String篇(上)(转)

原文出处: jaffa 很多时候我们在编写Java代码时,判断和猜测代码问题时主要是通过运行结果来得到答案,本博文主要是想通过Java字节码的方式来进一步求证我们已知的东西.这里没有对Java字节码知识进行介绍,如果想了解更多的Java字节码或对其感兴趣的朋友可以先阅读字节码基础:JVM字节码初探. String字面量可以通过'=='判断两个字符串是否相同,是因为大家都知道'=='是用来判断两个对象的值引用地址是否一致,两个值一样的字符串字面量定义是否指向同一个值内存地址呢?答案是肯定的. 1

Java字节码深入解析

一:Java字节代码的组织形式 类文件{ OxCAFEBABE,小版本号,大版本号,常量池大小,常量池数组,访问控制标记,当前类信息,父类信息,实现的接口个数,实现的接口信息数组,域个数,域信息数组,方法个数,方法信息数组,属性个数,属性信息数组 } 二:查看方法 --- javap命令 例子:有一个Java类Demo.java public class Demo {      private String str1;      private String str2;      private

通过java字节码分析学习对象初始化顺序_java

复制代码 代码如下: mockery.checking(new Expectations() {            {               one(new Object()).toString();               will(returnValue(""));           }       }); 下面写一个写一个简单的类演示这个例子 复制代码 代码如下: public class Test {     int i = 1;    {        int