源代码系列01——HashMap源码分析
从本篇文章开始,将正式进入源代码系列。源代码系列,将会首先进行源代码的分享,之后从面试官的角度出发,分享面试中出现的高频问题及其答案。
在进行Java技术面试时,如果聊到集合,那么HashMap几乎是绕不开的话题。本篇就从HashMap开始,分享HashMap的源代码。面试中HashMap的高频问题将在下篇进行分享。
1 HashMap的层次结构
HashMap的层级结构如图所示:
基于HashMap的层级结构,可以得到以下信息:
HashMap实现了Cloneable、Serializable接口,因此不必担心序列化相关的问题
HashMap继承了AbstractMap抽象类,AbstractMap则具有下述的方法
AbstractMap类的方法中,只有entrySet方法是抽象方法。其它方法中,有些方法(如size、get方法)提供了具体实现,有些方法(如put方法)会直接抛出异常,也就是需要继承类去重写。
AbstractMap的size方法如下所示:
public int size() {return entrySet().size();}
AbstractMap的put方法如下所示:
public V put(K key, V value) { // 此处直接抛出异常,需要继承类重写 throw new UnsupportedOperationException();}
2 HashMap的静态变量及成员变量
HashMap主要(非全部)的静态变量如下所示:
// 默认的初始容量,默认的数组长度,也就是16static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;// 最大容量static final int MAXIMUM_CAPACITY = 1 << 30;// 默认的装载因子static final float DEFAULT_LOAD_FACTOR = 0.75f;// 默认转换为红黑树的链表长度static final int TREEIFY_THRESHOLD = 8;// 默认取消红黑树的链表长度static final int UNTREEIFY_THRESHOLD = 6;// 变更为红黑树的最小数组长度,是否能够变更为红黑树的第二影响因素static final int MIN_TREEIFY_CAPACITY = 64;
HashMap主要(非全部)的成员变量如下所示:
// 数组,哈希桶transient Node<K,V>[] table;// HashMap中元素数量transient int size;// HashMap被修改的次数,用于简单实现并发判断等transient int modCount;// 下次扩容的阈值int threshold;// 装载因子final float loadFactor;
可以看到,table、size、modCount都使用了transient修饰。
3 HashMap中元素的表达方式
HashMap中的单个元素使用Node来进行表达,Node的定义如下所示:
static class Node<K,V> implements Map.Entry<K,V> {// hash值final int hash;// keyfinal K key;// valueV value;// 下个节点的指针Node<K,V> next;}
Node中,hash、key都使用了final进行修饰,这也是为什么hash、key不可修改的原因。同时,Node中还有一个next指针,用来指向下一个元素。
4 HashMap的hash方法
jdk1.8中,HashMap的hash方法基于key的hashCode生成,并利用了hashCode的高16位,尽量减少哈希碰撞。
static final int hash(Object key) {int h;// 计算hash时,也充分考虑高16位return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
5 HashMap的初始化
HashMap初始化的代码如下所示:
public HashMap(int initialCapacity, float loadFactor) {// 初始容量不能小于0if (initialCapacity < 0)throw new IllegalArgumentException("Illegal initial capacity: " +initialCapacity);// 初始容量不能大于最大容量if (initialCapacity > MAXIMUM_CAPACITY)initialCapacity = MAXIMUM_CAPACITY;// 装载因子必须合法if (loadFactor <= 0 || Float.isNaN(loadFactor))throw new IllegalArgumentException("Illegal load factor: " +loadFactor);this.loadFactor = loadFactor;// 计算扩容的阈值,此时threshold为16this.threshold = tableSizeFor(initialCapacity);}
在计算扩容阈值时,jdk1.8保证阈值是2的次幂,如下所示:
static final int tableSizeFor(int cap) {int n = cap - 1;n |= n >>> 1;n |= n >>> 2;n |= n >>> 4;n |= n >>> 8;n |= n >>> 16;return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;}
此外,在进行HashMap初始化时,不会初始化成员变量table。也就是说,HashMap初始化后,table依然为null。
6 向HashMap中添加元素
向HashMap中添加元素时,会面临多种情况。本文将对以下情况详细进行介绍。
首次向HashMap中添加元素
正常向HashMap中添加元素,无哈希冲突,无扩容,无红黑树转换
正常向HashMap中添加元素,哈希冲突,无扩容,无红黑树转换
添加元素后引发扩容
添加元素后引发红黑树转换
为了后续演示方便,本文构造DemoMapKey这个类,使之作为HashMap中元素的key。主要是为了重写hashCode方法,使其更容易出现哈希冲突。
DemoMapKey的定义如下所示:
/*** 测试类,省略setter、getter、equals方法*/public class DemoMapKey implements Serializable {/*** 编码,主要使用code生成hashCode*/private int code;/*** name*/private String name;public DemoMapKey(int code, String name) {this.code = code;this.name = name;}@Overridepublic int hashCode() {// 直接与32取余,便于实现哈希冲突return code % 32;}}
测试demo如下所示:
public class HashMapTest {public static void main(String[] args) {int count = 17;HashMap<DemoMapKey, Integer> testMap = new HashMap<>(16);for (int i = 1; i <= count; i++) {DemoMapKey keyEntry = new DemoMapKey(i, "test");// 第13个元素引发扩容if (i == 13) {System.out.println("添加第13个元素,引发扩容");}testMap.put(keyEntry, i);}}}
6.1、首次向HashMap中添加元素
首次向HashMap中添加元素时,代码执行路径如下所示:
public V put(K key, V value) {return putVal(hash(key), key, value, false, true);}// hash:key的hash值// key:添加元素的key// value:添加元素的value// onlyIfAbsent:是否只有key不存在时添加,put时默认为false// evict:表是否在创建模式,false表示处于创建模式,put时默认为truefinal V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {// 一些局部变量// tab:指向table,p:哈希桶内的元素// n:数组长度,i:插入元素应该在数组中的位置Node<K,V>[] tab; Node<K,V> p; int n, i;// 1、table为空,会进行扩容,实际是初始化if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 2、计算元素应该在的位置,数组当前位置无元素,故将此元素直接放在哈希桶中if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);}// 3、修改次数+1++modCount;// 4、元素数量+1,但是不需要扩容if (++size > threshold)resize();afterNodeInsertion(evict);return null;}final Node<K,V>[] resize() {// 指向旧的table,首次添加元素时为nullNode<K,V>[] oldTab = table;// 旧数组的容量,首次添加元素时为0int oldCap = (oldTab == null) ? 0 : oldTab.length;// 旧的阈值,当前值为16int oldThr = threshold;// 新数组容量,新的阈值int newCap, newThr = 0;// oldCap为0,因此不会走此处的逻辑if (oldCap > 0) {if (oldCap >= MAXIMUM_CAPACITY) {threshold = Integer.MAX_VALUE;return oldTab;}else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)newThr = oldThr << 1;}// 5、因为oldThr为16,所以会执行到这里else if (oldThr > 0)// 新数组容量设置为16newCap = oldThr;else {newCap = DEFAULT_INITIAL_CAPACITY;newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);}// 6、计算新的阈值if (newThr == 0) {float ft = (float)newCap * loadFactor;// 新的阈值为16*0.75=12newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?(int)ft : Integer.MAX_VALUE);}// 7、threshold变更为12threshold = newThr;// 8、新数组初始化@SuppressWarnings({"rawtypes","unchecked"})Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];// 9、将table指向新的数组table = newTab;return newTab;}Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {return new Node<>(hash, key, value, next);}
6.2、添加元素,无哈希冲突,不需要扩容及红黑树转换
若再次向HashMap中添加元素,会执行上述的2、3、4步,并且不会再执行扩容过程。在此不再赘述。
6.3、添加元素,发生哈希冲突,不需要扩容及红黑树转换
public V put(K key, V value) {return putVal(hash(key), key, value, false, true);}// hash:key的hash值// key:添加元素的key// value:添加元素的value// onlyIfAbsent:是否只有key不存在时添加,put时默认为false// evict:表是否在创建模式,false表示处于创建模式,put时默认为truefinal V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {// 一些局部变量// tab:指向table,p:哈希桶内的元素// n:数组长度,i:插入元素应该在数组中的位置Node<K,V>[] tab; Node<K,V> p; int n, i;// table不为空,因此不会走此处的逻辑if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 无哈希冲突if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);}else {// e:HashMap中已存在的元素Node<K,V> e; K k;// key完全相同,e指向当前元素if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;// 红黑树的处理逻辑else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {for (int binCount = 0; ; ++binCount) {// 1、将新增的元素添加到链表的尾部,采用尾插法// 元素添加后,e依然为nullif ((e = p.next) == null) {p.next = newNode(hash, key, value, null);if (binCount >= TREEIFY_THRESHOLD - 1)// 红黑树转换treeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) {V oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}// 2、修改次数+1++modCount;// 3、元素数量+1,但是不需要扩容if (++size > threshold)resize();afterNodeInsertion(evict);return null;}
6.4、添加元素后引发扩容
当添加到第13个元素时,元素数量将大于扩容阈值,进而引起HashMap的扩容。代码执行路径如下所示:
public V put(K key, V value) {return putVal(hash(key), key, value, false, true);}// hash:key的hash值// key:添加元素的key// value:添加元素的value// onlyIfAbsent:是否只有key不存在时添加,put时默认为false// evict:表是否在创建模式,false表示处于创建模式,put时默认为truefinal V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {// 一些局部变量// tab:指向table,p:哈希桶内的元素// n:数组长度,i:插入元素应该在数组中的位置Node<K,V>[] tab; Node<K,V> p; int n, i;if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 1、计算元素所在的数组位置,当前数组位置无元素,故将此元素直接放在哈希桶中if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);}// 2、修改次数+1++modCount;// 3、元素数量+1,此时size为13,大于threshold,也就是大于12,因此要进行扩容if (++size > threshold)resize();afterNodeInsertion(evict);return null;}final Node<K,V>[] resize() {// 指向旧的table,此时不为nullNode<K,V>[] oldTab = table;// 旧数组的容量,当前值为16int oldCap = (oldTab == null) ? 0 : oldTab.length;// 旧的阈值,当前值为12int oldThr = threshold;// 新数组容量,新的阈值int newCap, newThr = 0;// 4、oldCap为16,大于0,满足当前条件if (oldCap > 0) {if (oldCap >= MAXIMUM_CAPACITY) {threshold = Integer.MAX_VALUE;return oldTab;}// 5、newCap在oldCap基础上左移,也就是翻倍,16 -> 32,新的阈值也翻倍,变为24else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)newThr = oldThr << 1;}// 6、threshold变更为24threshold = newThr;// 7、新数组初始化@SuppressWarnings({"rawtypes","unchecked"})Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];// 8、将table指向新的数组table = newTab;// 9、进行元素的迁移if (oldTab != null) {for (int j = 0; j < oldCap; ++j) {// 链表的当前元素Node<K,V> e;// 哈希桶非空时才执行if ((e = oldTab[j]) != null) {oldTab[j] = null;// 只有哈希桶内一个元素,直接迁移// 迁移的位置为key的hash、数组长度-1进行与运算if (e.next == null)newTab[e.hash & (newCap - 1)] = e;// 红黑树的迁移else if (e instanceof TreeNode)((TreeNode<K,V>)e).split(this, newTab, j, oldCap);// 链表的迁移else {// 迁移后,低位的头尾指针,迁移时元素在数组中的位置不变Node<K,V> loHead = null, loTail = null;// 迁移后,高位的头尾指针,迁移时元素在数组中的位置发生变化Node<K,V> hiHead = null, hiTail = null;// 当前链表的下一个元素Node<K,V> next;do {next = e.next;// 元素key的hash、原始容量进行与运算,结果为0,表示位置不变// 比如,原始容量为16,换算为二进制为10000// 如果元素key的hash值小于16,则元素key的hash、原始容量进行与运算,结果一定为0// 如果元素key的hash值大于16,则可能出现在低位、也可能出现在高位,具体要看元素key的hash值// 比如,17(10001)在高位,32(100000)在低位if ((e.hash & oldCap) == 0) {// 低位的尾指针为空,证明还未构建低位的头尾指针if (loTail == null)// 设置低位的尾指针loHead = e;else// next设置loTail.next = e;// 低位尾指针的移动loTail = e;}else {// 高位的尾指针为空,证明还未构建高位的头尾指针if (hiTail == null)// 设置高位的尾指针hiHead = e;else// next设置hiTail.next = e;// 高位尾指针的移动hiTail = e;}} while ((e = next) != null);// 新数组j位置元素if (loTail != null) {loTail.next = null;newTab[j] = loHead;}// 新数组(j + 旧数组容量)位置元素if (hiTail != null) {hiTail.next = null;newTab[j + oldCap] = hiHead;}}}}}return newTab;}
6.5、添加元素后引发红黑树转换
为了模拟hash冲突,对测试demo进行变更。变更后的demo如下所示:
public class HashMapTest {public static void main(String[] args) {int count = 17;HashMap<DemoMapKey, Integer> testMap = new HashMap<>(16);for (int i = 1; i <= count; i++) {DemoMapKey keyEntry = new DemoMapKey(i * 32, "test");// 第9个元素,引发扩容if (i == 9) {System.out.println("添加第9个元素,引发扩容");}// 第11个元素,真正进行红黑树的转换if (i == 11) {System.out.println("添加第11个元素,引发红黑树转换");}testMap.put(keyEntry, i);}}}
当添加第9个元素时,原本应该进行红黑树转换。但此时数组的长度并未达到64,因此实际执行的是扩容。当添加第11个元素时,才会进行红黑树的转换。代码执行路径如下所示:
public V put(K key, V value) {return putVal(hash(key), key, value, false, true);}// hash:key的hash值// key:添加元素的key// value:添加元素的value// onlyIfAbsent:是否只有key不存在时添加,put时默认为false// evict:表是否在创建模式,false表示处于创建模式,put时默认为truefinal V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {// 一些局部变量// tab:指向table,p:哈希桶内的元素// n:数组长度,i:插入元素应该在数组中的位置Node<K,V>[] tab; Node<K,V> p; int n, i;// table不为空,因此不会走此处的逻辑if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;// 无哈希冲突if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);}else {// e:HashMap中已存在的元素Node<K,V> e; K k;// key完全相同,e指向当前元素if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;// 红黑树的处理逻辑else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {for (int binCount = 0; ; ++binCount) {if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);// 1、binCount达到7,也就意味着链表的长度达到8(不算哈希桶内元素)if (binCount >= TREEIFY_THRESHOLD - 1)// 红黑树转换treeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) {V oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}// 2、修改次数+1++modCount;// 3、元素数量+1,但是不需要扩容if (++size > threshold)resize();afterNodeInsertion(evict);return null;}final void treeifyBin(Node<K,V>[] tab, int hash) {int n, index; Node<K,V> e;// tab为空,或者数组长度未达到64,只进行扩容if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)resize();// 满足上述条件,才会进行红黑树的转换else if ((e = tab[index = (n - 1) & hash]) != null) {TreeNode<K,V> hd = null, tl = null;do {TreeNode<K,V> p = replacementTreeNode(e, null);if (tl == null)hd = p;else {p.prev = tl;tl.next = p;}tl = p;} while ((e = e.next) != null);if ((tab[index] = hd) != null)hd.treeify(tab);}}
7 元素的删除
HashMap中,元素的删除相对比较简单,在此不再过多赘述。
public V remove(Object key) {Node<K,V> e;return (e = removeNode(hash(key), key, null, false, true)) == null ?null : e.value;}final Node<K,V> removeNode(int hash, Object key, Object value,boolean matchValue, boolean movable) {// tab:指向table,n:table的长度// index:元素应该在数组中的位置Node<K,V>[] tab; Node<K,V> p; int n, index;if ((tab = table) != null && (n = tab.length) > 0 &&(p = tab[index = (n - 1) & hash]) != null) {// node:通过key获取到的元素// e:p的后置元素Node<K,V> node = null, e; K k; V v;// 哈希桶内元素判断if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))node = p;else if ((e = p.next) != null) {// 在红黑树中查找元素if (p instanceof TreeNode)node = ((TreeNode<K,V>)p).getTreeNode(hash, key);// 在链表中查找元素else {do {if (e.hash == hash &&((k = e.key) == key ||(key != null && key.equals(k)))) {node = e;break;}p = e;} while ((e = e.next) != null);}}// 元素存在if (node != null && (!matchValue || (v = node.value) == value ||(value != null && value.equals(v)))) {// 红黑树的处理,红黑树的自平衡、取消if (node instanceof TreeNode)((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);// 删除的元素位于哈希桶内else if (node == p)tab[index] = node.next;// 链表元素的删除elsep.next = node.next;++modCount;--size;afterNodeRemoval(node);return node;}}return null;}
8 元素的获取
HashMap中,元素的获取相对比较简单,在此不再过多赘述。
public V get(Object key) {Node<K,V> e;// 能够获取到元素就返回其值value,否则返回nullreturn (e = getNode(hash(key), key)) == null ? null : e.value;}final Node<K,V> getNode(int hash, Object key) {// tab:指向table,n:数组长度// first:哈希桶内元素Node<K,V>[] tab; Node<K,V> first, e; int n; K k;if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {// 查看哈希桶内元素,是否为需要获取的元素if (first.hash == hash &&((k = first.key) == key || (key != null && key.equals(k))))return first;if ((e = first.next) != null) {// 在红黑树中查找元素if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);// 在链表中查找元素do {if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}}return null;}
9 结语
jdk1.8中,HashMap的结构由数组+链表,变更为数组+链表+红黑树。其源代码中,有些地方的设计非常精妙,值得研发同学仔细阅读分析。
下一篇将分享HashMap的高频面试题及其答案,敬请期待。
最后,祝各位读者朋友工作顺利、心想事成。
