std::string在 Windows MSVC和Linux Gcc 中capacity容量扩容策略的分析和对比

发布时间:2023年12月25日

1、capacity()作用

? ? ? ?在std::string中,capacity()为当前string占用内存字符的长度,表示当前string的容量,可以理解为一个预分配制度,如果当前的string不断进行扩展操作,则不需要每次都进行内存上的分配,提高程序的运行效率。所以capacity的值会大于等于size,而不是代表当前string的实际大小。

2、Gcc分配策略

? ? ? ? 查看Gcc关于string的capacity的代码,大致如下:

分配通过_M_mutate实现,_M_mutate再调用_M_create,调用实际的分配策略。

_M_mutate():

_M_create():

_M_max_size()如下:

???????可以看到,当所要扩容后的capacity如果大于_M_max_size,会抛出异常。这里不展开关注,只需要关注在正常可以扩容的情况下的capacity的变化。如果所要扩容后的capacity大于老的capacity,则进行二倍的的扩展。这就是Gcc的分配策略。

3、MSVC分配策略

MSVC通过_Calculate_growth()完成capacity的扩容处理。代码如下:

? ? ? ? _ALLOC_MASK,为15,这个值是在编译期确定的值

????????每次capacity分配都会将需要将string的请求长度_Requested与_Alloc_Mask进行或运算,得到一个_Requested加上一个<=15的值_Masked如果该值大于_Max,则最大分配为_Max,不会像Gcc先抛出异常。

????????然后将该值与旧值大小的1/2增长进行比较,取两者的较大的值为新的capacity。

4、代码验证

????????测试思路,先定义一个空的string,查看初始的capacity值,然后做10次扩容测试,查看每次扩容后的capacity情况。

测试代码如下:

#include <iostream>
#include <string>
using namespace std;
int main()
{
    std::string str;
    std::cout<<"origin capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;
    for (int i = 0; i < 10; i++)
    {
        auto cap = str.capacity();
        while(str.size() <= cap)
        {
            str.append("1");
        }
        std::cout<<"capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;
    }
    return 0;
}

4.1 Windows下capacity变化情况

????????可以看出,一个空的string的capacity初始值系统分配为15,然后再扩容后,后面每次capacity的大小为size/2 + size

4.2 Linux下capacity变化情况

Linux下为一个空的string分配的初始capacity也是15,后面每次进行扩容,都是当前(size/2)*2。

5、横向比对Gcc和MSVC的分配策略

????????MSVC的扩容要小于Gcc下的扩容大小,这决定了在Linux下string进行不断进行增大时,效率要优于Windows,分配的频率会小于Windows。但是Linux下分配会占用的内存大于Windwos环境,这也可以理解,因为Linux本身运行的程序多为企业级多并发的大程序,利用Linux高资源的特点,可以用空间换时间,获得更快的运行效率。而Windows下运行的多为单机程序,运行的程序不像Linux环境下那么庞大,也不需要极致的空间置换时间,且Wndows的系统资源比较有限,这样可以在保证程序高效运行的情况下,兼顾系统资源在多程序之间的合理分配。

文章来源:https://blog.csdn.net/qq_39974998/article/details/135198704
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。