java 深拷贝探讨
本文将讨论以下4个问题
1. java Cloneable接口实现深拷贝
2. java 序列化实现深拷贝
3. 号称最快的深拷贝二方库cloning源码分析
4. 几种拷贝方式速度的比较
深拷贝的概念本文就不说了。在C++中实现深拷贝一般情况下重载赋值操作符 “=” 来实现同一个类的对象间的深拷贝,所以很自然的在java中我们也同样可以定义一个copy函数,在函数内部为对象的每一个属性作赋值操作。这种方式简单自然,但存在一个致命性的问题:如果有一天在类中新增加了一个需要深拷贝的属性,那么相应的copy函数也得进行修改,这种方法给类的可扩展性带来了极大的不方便。怎么解决这种问题,且看接下来的1、2、3章节的实现方式和4节的速度测试。
1. java Cloneable接口实现深拷贝
这种方式,需要类实现Colneable接口 clone 函数,在clone函数中调用super.clone。这种方式的深拷贝同样会带来另一个问题,如果类中有其他类的对象作为属性,则其他的类也需要重载并实现Cloneable接口。来一个例子,在下例中ComplexDO中包含了SimpleDO对象,要实现ComplexDO深拷贝,则需要先实现SimpleDO的clone接口:
public class SimpleDO implements Cloneable, Serializable {
private int x = 1;
private String s = "simpleDO";
@Override
protected Object clone() throws CloneNotSupportedException {
SimpleDO newClass = (SimpleDO)super.clone();
return newClass;
}
}
public class ComplexDO implements Cloneable, Serializable {
private int x = 1;
private String s = "complex";
private Integer a = 123;
private Integer b = 1234;
private Integer c = 1334455;
private String s2 = "hehehe";
private String s3 = "hahahaha";
private Long id = 1233245L;
private ArrayList<SimpleDO> l = new ArrayList<SimpleDO>();
@Override
public Object clone() throws CloneNotSupportedException {
ComplexDO newClass = (ComplexDO) super.clone();
newClass.l = new ArrayList<SimpleDO>();
for (SimpleDO simple : this.l) {
newClass.l.add((SimpleDO) simple.clone());
}
return newClass;
}
}
需要注意的是很多文章说String类型的对象赋值操作符是深拷贝,但是其实在java中使用赋值操作符的都属于浅拷贝,但为什么这么明显的错误这么多的文章会非要说这个是深拷贝呢?我的理解是String、类型的属性都是基本类型,而且提供的方法只要是设计到内部数据的变动都会new一个新的对象出来。所以一个String的操作不会影响到其原先指向的内存。所以一般说String等基础类的赋值操作为深拷贝。
由于这个原因,在使用String字符串拼接的时候,需要开辟新的内存,所以很多人建议用StringBuilder来代替String来做拼接,因为StringBuilder只有在内置的char数组范围不够的时候才重新申请更大的内存(对于现代JVM,会对代码调优,String+String会被优化成StringBuilder.append的相类似的指令)。与拼接相对的裁剪,在String有个subString函数,当使用subString函数时,新String的内部char数组和原String是否相同?这个比较有意思,感兴趣的可以对比看看JDK1.6和JKD1.7的实现。
2. java 序列化实现深拷贝
这种方式的原理是利用java序列化,将一个对象序列化成二进制字节流,然后对该字节流反序列化赋值给一个对象。代码示例:
public Object seirCopy(Object src) {
try {
ByteArrayOutputStream byteOut = new ByteArrayOutputStream();
ObjectOutputStream out = new ObjectOutputStream(byteOut);
out.writeObject(src);
ByteArrayInputStream byteIn = new ByteArrayInputStream(byteOut.toByteArray());
ObjectInputStream in = new ObjectInputStream(byteIn);
Object dest = in.readObject();
return dest;
} catch (Exception e) {
//do some error handler
return null;
}
}
当然,也可以选用json等序列化的库来完成序列化,这种方式有效的规避了Cloneabel接口的可扩展缺点,一个函数就可以基本上适用于所有的类.缺点是相对内存拷贝,序列化需要先将对象转换成二进制字节流,然后反序列化将该二进制字节流重新拷贝到一块对象内存,相对慢点。
3. 号称最快的深拷贝二方库cloning源码分析
先上源码心得:在cloning中源码中,拷贝的过程主要是靠递归来实现,即对对象内部的每一个属性对象递归调用,直到该属性可直接赋值为止。拷贝的机制是通过反射拿到对象内部的每一个属性,使用Objenesis框架生成该属性的类的新对象,然后赋值。
再看看源码的类图(图中的直线箭头表示调用):
在源码中,核心的处理逻辑在Cloner类中,
分两条递归链路:
- (1)deepClone->cloneInternal->fastClone->cloneInternal
- (2)deepClone->cloneInternal->cloneObject->cloneInternal
在(1)中fastClone完成的是继承自IfastCloner接口类的对象,即都是些集合操作的拷贝;
在(2)中cloneObject完成的是通过反射机制拿到普通对象的每一个属性,然后对使用Objenesis新生成对象的属性赋值。
这种方式可扩展性强,不仅可以依靠其现有的代码完成深拷贝,还可以自己定义一些克隆的方式和不需要克隆的类型,灵活性强。
放上源码链接,代码量小,逻辑清晰,适合阅读:https://github.com/kostaskougios/cloning
4. 几种拷贝方式速度的比较
上述3中模式都可以完成深拷贝,那种拷贝的方式速度最快是我们所关心的。
先上测试代码:
public void testCloneComplex() throws CloneNotSupportedException {
final int copyCount = 1;
List<ComplexDO> complexDOList = new ArrayList<ComplexDO>(copyCount * 3);
final ComplexDO complex = new ComplexDO();
//调用二方库
long start = System.currentTimeMillis();
for(int i = 0; i < copyCount; ++i) {
final ComplexDO deepClone = cloner.deepClone(complex);
complexDOList.add(deepClone);
}
long end = System.currentTimeMillis();
System.out.println("deepClone cost time=" + (end-start));
//调用Cloneable接口实现的clone函数
start = System.currentTimeMillis();
for(int i = 0; i < copyCount; ++i) {
final ComplexDO interfaceClone = (ComplexDO) complex.clone();
complexDOList.add(interfaceClone);
}
end = System.currentTimeMillis();
System.out.println("interfaceClone cost time=" + (end-start));
//序列化与反序列化生成新对象
start = System.currentTimeMillis();
for(int i = 0; i < copyCount; ++i) {
final ComplexDO seirClone = seirCopy(complex);
complexDOList.add(seirClone);
}
end = System.currentTimeMillis();
System.out.println("seirClone cost time=" + (end-start));
}
拷贝次数 | clone接口拷贝 | 序列化拷贝 | cloning库拷贝 |
---|---|---|---|
1 | 0 | 70 | 14 |
100 | 0 | 198 | 26 |
1000 | 4 | 1259 | 172 |
运行结果的单位为毫秒(此数据忽略不计算java热点和可能的gc)。从这个表可以得出结论:
- 实现Cloneable接口的拷贝是最快的,因为他只涉及到了内存拷贝,但是如果涉及的属性为普通对象比较多的时候写起来麻烦点
- 序列化/反序列化拷贝最慢
- 使用cloning库,由于使用了递归和反射机制相对Cloneable接口实现的拷贝要慢,但比序列化方式要快。