源代码系列01——HashMap源码分析
从本篇文章开始,将正式进入源代码系列。源代码系列,将会首先进行源代码的分享,之后从面试官的角度出发,分享面试中出现的高频问题及其答案。
在进行Java技术面试时,如果聊到集合,那么HashMap几乎是绕不开的话题。本篇就从HashMap开始,分享HashMap的源代码。面试中HashMap的高频问题将在下篇进行分享。
1 HashMap的层次结构
HashMap的层级结构如图所示:
基于HashMap的层级结构,可以得到以下信息:
HashMap实现了Cloneable、Serializable接口,因此不必担心序列化相关的问题
HashMap继承了AbstractMap抽象类,AbstractMap则具有下述的方法
AbstractMap类的方法中,只有entrySet方法是抽象方法。其它方法中,有些方法(如size、get方法)提供了具体实现,有些方法(如put方法)会直接抛出异常,也就是需要继承类去重写。
AbstractMap的size方法如下所示:
public int size() {
return entrySet().size();
}
AbstractMap的put方法如下所示:
public V put(K key, V value) { // 此处直接抛出异常,需要继承类重写 throw new UnsupportedOperationException();}
2 HashMap的静态变量及成员变量
HashMap主要(非全部)的静态变量如下所示:
// 默认的初始容量,默认的数组长度,也就是16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认的装载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 默认转换为红黑树的链表长度
static final int TREEIFY_THRESHOLD = 8;
// 默认取消红黑树的链表长度
static final int UNTREEIFY_THRESHOLD = 6;
// 变更为红黑树的最小数组长度,是否能够变更为红黑树的第二影响因素
static final int MIN_TREEIFY_CAPACITY = 64;
HashMap主要(非全部)的成员变量如下所示:
// 数组,哈希桶
transient Node<K,V>[] table;
// HashMap中元素数量
transient int size;
// HashMap被修改的次数,用于简单实现并发判断等
transient int modCount;
// 下次扩容的阈值
int threshold;
// 装载因子
final float loadFactor;
可以看到,table、size、modCount都使用了transient修饰。
3 HashMap中元素的表达方式
HashMap中的单个元素使用Node来进行表达,Node的定义如下所示:
static class Node<K,V> implements Map.Entry<K,V> {
// hash值
final int hash;
// key
final K key;
// value
V value;
// 下个节点的指针
Node<K,V> next;
}
Node中,hash、key都使用了final进行修饰,这也是为什么hash、key不可修改的原因。同时,Node中还有一个next指针,用来指向下一个元素。
4 HashMap的hash方法
jdk1.8中,HashMap的hash方法基于key的hashCode生成,并利用了hashCode的高16位,尽量减少哈希碰撞。
static final int hash(Object key) {
int h;
// 计算hash时,也充分考虑高16位
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
5 HashMap的初始化
HashMap初始化的代码如下所示:
public HashMap(int initialCapacity, float loadFactor) {
// 初始容量不能小于0
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
// 初始容量不能大于最大容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
// 装载因子必须合法
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
// 计算扩容的阈值,此时threshold为16
this.threshold = tableSizeFor(initialCapacity);
}
在计算扩容阈值时,jdk1.8保证阈值是2的次幂,如下所示:
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
此外,在进行HashMap初始化时,不会初始化成员变量table。也就是说,HashMap初始化后,table依然为null。
6 向HashMap中添加元素
向HashMap中添加元素时,会面临多种情况。本文将对以下情况详细进行介绍。
首次向HashMap中添加元素
正常向HashMap中添加元素,无哈希冲突,无扩容,无红黑树转换
正常向HashMap中添加元素,哈希冲突,无扩容,无红黑树转换
添加元素后引发扩容
添加元素后引发红黑树转换
为了后续演示方便,本文构造DemoMapKey这个类,使之作为HashMap中元素的key。主要是为了重写hashCode方法,使其更容易出现哈希冲突。
DemoMapKey的定义如下所示:
/**
* 测试类,省略setter、getter、equals方法
*/
public class DemoMapKey implements Serializable {
/**
* 编码,主要使用code生成hashCode
*/
private int code;
/**
* name
*/
private String name;
public DemoMapKey(int code, String name) {
this.code = code;
this.name = name;
}
@Override
public int hashCode() {
// 直接与32取余,便于实现哈希冲突
return code % 32;
}
}
测试demo如下所示:
public class HashMapTest {
public static void main(String[] args) {
int count = 17;
HashMap<DemoMapKey, Integer> testMap = new HashMap<>(16);
for (int i = 1; i <= count; i++) {
DemoMapKey keyEntry = new DemoMapKey(i, "test");
// 第13个元素引发扩容
if (i == 13) {
System.out.println("添加第13个元素,引发扩容");
}
testMap.put(keyEntry, i);
}
}
}
6.1、首次向HashMap中添加元素
首次向HashMap中添加元素时,代码执行路径如下所示:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
// hash:key的hash值
// key:添加元素的key
// value:添加元素的value
// onlyIfAbsent:是否只有key不存在时添加,put时默认为false
// evict:表是否在创建模式,false表示处于创建模式,put时默认为true
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// 一些局部变量
// tab:指向table,p:哈希桶内的元素
// n:数组长度,i:插入元素应该在数组中的位置
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 1、table为空,会进行扩容,实际是初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 2、计算元素应该在的位置,数组当前位置无元素,故将此元素直接放在哈希桶中
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
}
// 3、修改次数+1
++modCount;
// 4、元素数量+1,但是不需要扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
final Node<K,V>[] resize() {
// 指向旧的table,首次添加元素时为null
Node<K,V>[] oldTab = table;
// 旧数组的容量,首次添加元素时为0
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 旧的阈值,当前值为16
int oldThr = threshold;
// 新数组容量,新的阈值
int newCap, newThr = 0;
// oldCap为0,因此不会走此处的逻辑
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1;
}
// 5、因为oldThr为16,所以会执行到这里
else if (oldThr > 0)
// 新数组容量设置为16
newCap = oldThr;
else {
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 6、计算新的阈值
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
// 新的阈值为16*0.75=12
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
// 7、threshold变更为12
threshold = newThr;
// 8、新数组初始化
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
// 9、将table指向新的数组
table = newTab;
return newTab;
}
Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {
return new Node<>(hash, key, value, next);
}
6.2、添加元素,无哈希冲突,不需要扩容及红黑树转换
若再次向HashMap中添加元素,会执行上述的2、3、4步,并且不会再执行扩容过程。在此不再赘述。
6.3、添加元素,发生哈希冲突,不需要扩容及红黑树转换
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
// hash:key的hash值
// key:添加元素的key
// value:添加元素的value
// onlyIfAbsent:是否只有key不存在时添加,put时默认为false
// evict:表是否在创建模式,false表示处于创建模式,put时默认为true
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict
) {
// 一些局部变量
// tab:指向table,p:哈希桶内的元素
// n:数组长度,i:插入元素应该在数组中的位置
Node<K,V>[] tab; Node<K,V> p; int n, i;
// table不为空,因此不会走此处的逻辑
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 无哈希冲突
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
}
else {
// e:HashMap中已存在的元素
Node<K,V> e; K k;
// key完全相同,e指向当前元素
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 红黑树的处理逻辑
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
// 1、将新增的元素添加到链表的尾部,采用尾插法
// 元素添加后,e依然为null
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1)
// 红黑树转换
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
// 2、修改次数+1
++modCount;
// 3、元素数量+1,但是不需要扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
6.4、添加元素后引发扩容
当添加到第13个元素时,元素数量将大于扩容阈值,进而引起HashMap的扩容。代码执行路径如下所示:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
// hash:key的hash值
// key:添加元素的key
// value:添加元素的value
// onlyIfAbsent:是否只有key不存在时添加,put时默认为false
// evict:表是否在创建模式,false表示处于创建模式,put时默认为true
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// 一些局部变量
// tab:指向table,p:哈希桶内的元素
// n:数组长度,i:插入元素应该在数组中的位置
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 1、计算元素所在的数组位置,当前数组位置无元素,故将此元素直接放在哈希桶中
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
}
// 2、修改次数+1
++modCount;
// 3、元素数量+1,此时size为13,大于threshold,也就是大于12,因此要进行扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
final Node<K,V>[] resize() {
// 指向旧的table,此时不为null
Node<K,V>[] oldTab = table;
// 旧数组的容量,当前值为16
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 旧的阈值,当前值为12
int oldThr = threshold;
// 新数组容量,新的阈值
int newCap, newThr = 0;
// 4、oldCap为16,大于0,满足当前条件
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 5、newCap在oldCap基础上左移,也就是翻倍,16 -> 32,新的阈值也翻倍,变为24
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1;
}
// 6、threshold变更为24
threshold = newThr;
// 7、新数组初始化
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
// 8、将table指向新的数组
table = newTab;
// 9、进行元素的迁移
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
// 链表的当前元素
Node<K,V> e;
// 哈希桶非空时才执行
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
// 只有哈希桶内一个元素,直接迁移
// 迁移的位置为key的hash、数组长度-1进行与运算
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
// 红黑树的迁移
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
// 链表的迁移
else {
// 迁移后,低位的头尾指针,迁移时元素在数组中的位置不变
Node<K,V> loHead = null, loTail = null;
// 迁移后,高位的头尾指针,迁移时元素在数组中的位置发生变化
Node<K,V> hiHead = null, hiTail = null;
// 当前链表的下一个元素
Node<K,V> next;
do {
next = e.next;
// 元素key的hash、原始容量进行与运算,结果为0,表示位置不变
// 比如,原始容量为16,换算为二进制为10000
// 如果元素key的hash值小于16,则元素key的hash、原始容量进行与运算,结果一定为0
// 如果元素key的hash值大于16,则可能出现在低位、也可能出现在高位,具体要看元素key的hash值
// 比如,17(10001)在高位,32(100000)在低位
if ((e.hash & oldCap) == 0) {
// 低位的尾指针为空,证明还未构建低位的头尾指针
if (loTail == null)
// 设置低位的尾指针
loHead = e;
else
// next设置
loTail.next = e;
// 低位尾指针的移动
loTail = e;
}
else {
// 高位的尾指针为空,证明还未构建高位的头尾指针
if (hiTail == null)
// 设置高位的尾指针
hiHead = e;
else
// next设置
hiTail.next = e;
// 高位尾指针的移动
hiTail = e;
}
} while ((e = next) != null);
// 新数组j位置元素
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
// 新数组(j + 旧数组容量)位置元素
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
6.5、添加元素后引发红黑树转换
为了模拟hash冲突,对测试demo进行变更。变更后的demo如下所示:
public class HashMapTest {
public static void main(String[] args) {
int count = 17;
HashMap<DemoMapKey, Integer> testMap = new HashMap<>(16);
for (int i = 1; i <= count; i++) {
DemoMapKey keyEntry = new DemoMapKey(i * 32, "test");
// 第9个元素,引发扩容
if (i == 9) {
System.out.println("添加第9个元素,引发扩容");
}
// 第11个元素,真正进行红黑树的转换
if (i == 11) {
System.out.println("添加第11个元素,引发红黑树转换");
}
testMap.put(keyEntry, i);
}
}
}
当添加第9个元素时,原本应该进行红黑树转换。但此时数组的长度并未达到64,因此实际执行的是扩容。当添加第11个元素时,才会进行红黑树的转换。代码执行路径如下所示:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
// hash:key的hash值
// key:添加元素的key
// value:添加元素的value
// onlyIfAbsent:是否只有key不存在时添加,put时默认为false
// evict:表是否在创建模式,false表示处于创建模式,put时默认为true
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// 一些局部变量
// tab:指向table,p:哈希桶内的元素
// n:数组长度,i:插入元素应该在数组中的位置
Node<K,V>[] tab; Node<K,V> p; int n, i;
// table不为空,因此不会走此处的逻辑
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 无哈希冲突
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
}
else {
// e:HashMap中已存在的元素
Node<K,V> e; K k;
// key完全相同,e指向当前元素
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 红黑树的处理逻辑
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 1、binCount达到7,也就意味着链表的长度达到8(不算哈希桶内元素)
if (binCount >= TREEIFY_THRESHOLD - 1)
// 红黑树转换
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
// 2、修改次数+1
++modCount;
// 3、元素数量+1,但是不需要扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
// tab为空,或者数组长度未达到64,只进行扩容
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
// 满足上述条件,才会进行红黑树的转换
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K,V> hd = null, tl = null;
do {
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}
7 元素的删除
HashMap中,元素的删除相对比较简单,在此不再过多赘述。
public V remove(Object key) {
Node<K,V> e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
// tab:指向table,n:table的长度
// index:元素应该在数组中的位置
Node<K,V>[] tab; Node<K,V> p; int n, index;
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
// node:通过key获取到的元素
// e:p的后置元素
Node<K,V> node = null, e; K k; V v;
// 哈希桶内元素判断
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
else if ((e = p.next) != null) {
// 在红黑树中查找元素
if (p instanceof TreeNode)
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
// 在链表中查找元素
else {
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
// 元素存在
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
// 红黑树的处理,红黑树的自平衡、取消
if (node instanceof TreeNode)
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
// 删除的元素位于哈希桶内
else if (node == p)
tab[index] = node.next;
// 链表元素的删除
else
p.next = node.next;
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
8 元素的获取
HashMap中,元素的获取相对比较简单,在此不再过多赘述。
public V get(Object key) {
Node<K,V> e;
// 能够获取到元素就返回其值value,否则返回null
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
// tab:指向table,n:数组长度
// first:哈希桶内元素
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 查看哈希桶内元素,是否为需要获取的元素
if (first.hash == hash &&
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
// 在红黑树中查找元素
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
// 在链表中查找元素
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
9 结语
jdk1.8中,HashMap的结构由数组+链表,变更为数组+链表+红黑树。其源代码中,有些地方的设计非常精妙,值得研发同学仔细阅读分析。
下一篇将分享HashMap的高频面试题及其答案,敬请期待。
最后,祝各位读者朋友工作顺利、心想事成。