Java容器类库定义了两个不同概念的容器,Collection和Map
- Collection 一个独立元素的序列,这些元素都服从一条或多条规则。List必须按照插入的顺序保存元素。Set不能有重复元素。Queue按照排队规则来确定对象产生的顺序。
(文中Jdk源码版本无特殊说明均为jdk1.8.0_101)
public interface Collection<E> extends Iterable<E> {
可以看到,java定义了Collection接口和内部集合的基本操作方法,Collection默认可以进行对集合末端添加元素,删除指定元素等操作。List、Set、Queue接口都继承自Collection并定义了各自不同的方法。如果你想学习Java可以来这个群,首先是二二零,中间是一四二,最后是九零六,里面有大量的学习资料可以下载。
- Map 一组成对的”键值对”对象,允许我们使用键来查找值。
public interface Map<K,V> {
Map内部接口Entry<K,V>对应着Map的键值对。
具体介绍
迭代器
先介绍一下迭代器。迭代器本身也是一种设计模式,设计的初衷在于:容器的实现由很多种,而我们想对容器进行遍历操作的话,首先不应该关心容器实现的细节,其次遍历操作应该是轻量级的。迭代器统一了对容器的访问方式,同时创建它的代价很小。值得注意的是,Iterator只能单向移动。
public interface Iterator<E> {
通过容器的iterator()方法拿到容器的迭代器
迭代器的next()获取下一个元素
hasNext()判断是否还有元素
remove()删除指定元素
ListIterator
ListIterator是Iterator的扩展之内,用于各种List类访问,支持双向移动。
Collection
List
List 承诺可以将元素维护在特定的序列中.List接口在Collection的基础上添加了大量的方法,使得可以再List中间插入和移除元素。
public interface List<E> extends Collection<E> {
有两种类型的List,ArrayList和LinkedList
List类型 | 优点 | 缺点 | 底层实现 |
---|---|---|---|
ArrayList | 随机访问元素较快 | 中间元素的插入和删除较慢 | 数组 |
LinkedList | 中间元素的插入和删除,顺序访问的优化 | 随机访问元素较慢 | 双向链表 |
Set
Set不保存重复的元素,通常用于快速查找元素。值得一提的是,Set具有与Collection完全一样的接口,没有任何额外的功能。 存入的元素必须定义equals()方法
Set类型 | 使用场景 | 底层实现 |
---|---|---|
HashSet | 快速查找,元素必须定义hashCode() | 链表 |
TreeSet | 保持次序,元素必须实现Comparable接口 | 红-黑树结构 |
LinkedHashSet | 维护次序的HashSet, 元素必须定义hashCode() | 链表 |
Queue
除了并发应用,Queue仅有的两个实现是LinkedList和PriorityQueue, 其中LinkedList同时实现了List, Deque接口。它们的差异在于排序行为而不是性能。
public interface Queue<E> extends Collection<E> {
Map
Map类型 | 使用场景 | 底层实现 |
---|---|---|
HashMap | 快速查询 | 散列表 |
LinkedHashMap | 迭代遍历具有顺序(插入顺序 or 最近最少使用) | 链表 |
TreeMap | 具有排序,唯一可以返回子树的Map(subMap()) | 红-黑树结构 |
WeakHashMap | 弱键映射,映射之外无引用的键,可以被垃圾回收 | 散列表 |
ConcurrentHashMap | 线程安全的Map | 链表 |
IdentityHashMap | 使用==代替equals()对键进行排序,专位解决特殊问题 | 链表 |
我们可以手工调整HashMap来调整性能,涉及到如容量、初始容量、尺寸、负载因子等概念。感兴趣的话可以看一些相关资料。如果你想学习Java可以来这个群,首先是二二零,中间是一四二,最后是九零六,里面有大量的学习资料可以下载。
一些建议
- 不要使用过时的容器 如Vector Enumeration Hashtable Stack(没错,这就是java最初的糟糕设计,实际中使用栈的话推荐LinkedList)
进阶·并发容器
这里不会讨论的太细致的实现,仅仅简单介绍一下基础知识,感兴趣的可以阅读《Java 并发编程的艺术》这本书。
CopyOnWriteArrayList与Copy-On-Write策略
Copy-On-Write简称COW,是一种用于程序设计中的优化策略。其基本思路是,从一开始大家都在共享同一个内容,当某个人想要修改这个内容的时候,才会真正把内容Copy出去形成一个新的内容然后再改,这是一种延时懒惰策略。从JDK1.5开始Java并发包里提供了两个使用CopyOnWrite机制实现的并发容器,它们是CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用,可以在非常多的并发场景中使用到。
CopyOnWrite容器即写时复制的容器。通俗的理解是当我们往一个容器添加元素的时候,不直接往当前容器添加,而是先将当前容器进行Copy,复制出一个新的容器,然后新的容器里添加元素,添加完元素之后,再将原容器的引用指向新的容器。这样做的好处是我们可以对CopyOnWrite容器进行并发的读,而不需要加锁,因为当前容器不会添加任何元素。所以CopyOnWrite容器也是一种读写分离的思想,读和写不同的容器。
CopyOnWrite容器只能保证数据的最终一致性,不能保证数据的实时一致性。所以如果你希望写入的的数据,马上能读到,请不要使用CopyOnWrite容器。
ConcurrentLinkedQueue
在并发编程中,有时候需要使用线程安全的队列或列表。通常实现线程安全有两种方式,一种是使用阻塞算法,一种是使用非阻塞算法。非阻塞算法实现基础为循环CAS(Compare and Swipe 比较和交换)。
ConcurrentLinkedQueue技术上的实现与CopyOnWriteArrayList与Copy类似,但是容器只有部分内容而不是整个容器可以被复制和修改。ConcurrentLinkedQueue有head节点和tail节点组成,每个节点由节点元素(item)和指向下一个结点(next)的引用组成。节点之间通过next关联起来,形成一张链表结构的队列。
ConcurrentHashMap与锁分段技术
ConcurrentHashMap是线程安全且高效的HashMap。多线程环境下,使用非线程安全的HashMap会导致死循环,而如文章中建议的那样,HashTable这种过时容器效率低下(使用synchronized来保证线程安全)。ConcurrentHashMap使用锁分段技术,大大提高了并发使用的效率。
锁分段技术: 假设容器有多把锁,每一把锁用于锁容器其中一部分数据,当多线程访问容器不同数据段数据时,线程间就不存在锁竞争,从而提高并发访问效率。
阻塞队列
JDK7 提供了7个阻塞队列,实现原理都是基于生产-消费模式的等待通知机制。
阻塞队列类型 | 特点 |
---|---|
ArrayBlockingQueue | 由数组结构组成的有界阻塞队列 |
LinkedBlockingQueue | 由链表结构组成的有界阻塞队列 |
PriorityBlockingQueue | 支持优先级排序的无界阻塞队列 |
DelayQueue | 使用优先级队列实现的无界阻塞队列 |
SynchronousQueue | 不储存元素的阻塞队列 |
LinkedTransferQueue | 由链表结构组成的无界阻塞队列 |
LinkedBlockingQueue | 由链表结构组成的双向阻塞队列 |