【Java并发】聊聊concurrentHashMap扩容核心流程

发布时间:2024年01月21日

扩容

什么时候扩容

  • 链表转红黑树。需要判断数组长度,触发扩容
  • 调用putAll() , 触发tryPresize() 方法
  • 数据量达到阈值

tryPresize-初始化数组

   // 扩容前操作,putAll or 链表转红黑树 
    // size是原数组长度 * 2
    private final void tryPresize(int size) {
        // putAll()使用,插入map的长度 (putAll)
        // size > 最大长度 / 2 就是最大值
        // 否则将长度设置为2的幂次
        // c是初始化数组长度
        int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
            tableSizeFor(size + (size >>> 1) + 1);
        int sc;
        //sizeCtl
     // -1:正在初始化数组,小于-1:正在扩容,0:代表还没初始化数组,大于0:可能初始化了(代表阈值),也可能没初始化(初始化的长度)
        // 没有正在进行初始化 或者 正在扩容
        while ((sc = sizeCtl) >= 0) {
            Node<K,V>[] tab = table; int n;
             //数组没有初始化 ,在put方法的时候,其实也走了这样的逻辑。
            if (tab == null || (n = tab.length) == 0) {
               // 在sc和c之间 选择最大值作为初始化长度 
                n = (sc > c) ? sc : c;
                // 初始化 sizeCtl = -1 
                if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                    try {
                        if (table == tab) {
                            @SuppressWarnings("unchecked")
                            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                            table = nt;
                            sc = n - (n >>> 2);
                        }
                    } finally {
                        sizeCtl = sc;
                    }
                }
            }
            else if (c <= sc || n >= MAXIMUM_CAPACITY)
                break;
            // 扩容前操作    
            else if (tab == table) {
                 // 计算扩容标识戳 多线程迁移数据
                int rs = resizeStamp(n);
                if (sc < 0) { // 正在扩容 or 初始化
                    Node<K,V>[] nt;
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                // 当前执行扩容,可能是第一个进来执行扩容的线程
                // CAS = SIZECTL  一定是小于 -1
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    //开始扩容 传输老数组
                    transfer(tab, null);
            }
        }
    }

1.计算表示戳
2.正在扩容线程数

tryPreSize方法-扩容标识戳

    static final int resizeStamp(int n) {
    // 32~64
    // 00000000 00000000 00000000 00011010
    // 计算n在二进制表示时,前面有多少个0
    // 00000000 00000000 10000000 00000000
    // 00000000 00000000 10000000 00011010
    // 前面的操作是基于数组长度等到一个标识,方便其他线程参与扩容
    // 后面的值是为了保证当前扩容戳左移16位之后,一定是一个负数
        return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
    }

扩容操作 transfer

    private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        int n = tab.length, stride;
        // 不超过CPU内核数的线程进行扩容
        // 计算每个线程处理数据的区间大小 最小是16
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        // 新数组没有初始化 进行初始化 
        // 在原来的基础上扩大两倍  
        if (nextTab == null) {            // initiating
            try {
                @SuppressWarnings("unchecked")
                // 初始化数组 扩大两倍
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {      // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            
            transferIndex = n;
            // transferIndex old数组的长度
        }
        // n :老数组长度 
        // stride: 步长
        // nextTable, nextTab : 新数组
        // nextn : 新数组长度
        // transferIndex 线程领取任务时的核心属性
        int nextn = nextTab.length;
        //先声明fwd节点、在老数组迁移数据完成后,将fwd赋值上去
        // 表示已经迁移完的,完成迁移 修改成fwd 
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
        boolean advance = true;
        boolean finishing = false; // to ensure sweep before committing nextTab
        for (int i = 0, bound = 0;;) {
            Node<K,V> f; int fh;
            while (advance) {
                int nextIndex, nextBound;
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }
            // 是否扩容完成
            if (i < 0 || i >= n || i + n >= nextn) {
                int sc;
                if (finishing) {
                    nextTable = null;
                    table = nextTab;
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                //每操作一次 -1 
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                    // 
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    finishing = advance = true;
                    i = n; // recheck before commit
                }
            }
            // 当前数组为空,直接修改成fwd 表示迁移完成
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
            //当前节点 以及迁移完毕 。如果是 进入下一次遍历    
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else {
                // 针对当前要迁移的节点 加syn🔒
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        Node<K,V> ln, hn;
                        if (fh >= 0) {
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            // == 0 不用迁移
                            if (runBit == 0) {
                                ln = lastRun;
                                hn = null;
                            }
                            else {
                                hn = lastRun;
                                ln = null;
                            }
                            for (Node<K,V> p = f; p != lastRun; p = p.next) {
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            //新数组的原来的下标
                            setTabAt(nextTab, i, ln);
                            // 新数组的新位置
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        //树的方式进行迁移
                        else if (f instanceof TreeBin) {
                            TreeBin<K,V> t = (TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                    (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                    }
                }
            }
        }
    }

在这里插入图片描述

size如何进行统计?

因为chm是put线程安全,且同一时刻可能多个线程操作数据,那么如何统计有多少个元素呢,如果使用cas的方式,也就是atoxxx的。在并发量小的时候可以计算。当并发量比较高的时候,性能就下降了。chm很巧妙的通过并发的粒度来做的处理。
当并发量竞争小的时候通过size 进行统计,当并发竞争高cas失败的时候,每个链表维护一个一个cell,当调用size 统计的时候,在逐个统计。但是可能存在数据不准确,是一种弱一致性。

    private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
         // 统计元素的个数
        if ((as = counterCells) != null ||
            // cas 修改baseCount 
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                  // 添加元素个数
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();
        }
        // 是否要做扩容
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            // 第一次扩容的场景
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);
                if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }
    }

在这里插入图片描述

    final long sumCount() {
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        //as != null 说明竞争高,使用countterCell 数组统计,否则直接返回sum的和
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }

get()

在查询数据时,会先判断当前key对应的value,是否在数组上。

其次会判断当前位置是否属于特殊情况:数据被迁移、位置被占用、红黑树结构

最后判断链表上是否有对应的数据。

找到返回指定的value,找不到返回null即可

    public V get(Object key) {
        Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
        // 和put时一样的操作,先计算k的hashcode 
        int h = spread(key.hashCode());
        // 对应的下标不为空
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {
            // 第一个元素就是 直接返回
            if ((eh = e.hash) == h) {
                if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                    return e.val;
            }
            // 树结构查找
            else if (eh < 0)
                return (p = e.find(h, key)) != null ? p.val : null;
            // 链表结构查找
            while ((e = e.next) != null) {
                if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                    return e.val;
            }
        }
        return null;
    }

针对于chm,主要从几个方面学习

  • 1.7 8的区别
  • put核心流程
  • get核心流程
  • 扩容流程
  • size流程
文章来源:https://blog.csdn.net/jia970426/article/details/135612066
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。