? ? ? ?在std::string中,capacity()为当前string占用内存字符的长度,表示当前string的容量,可以理解为一个预分配制度,如果当前的string不断进行扩展操作,则不需要每次都进行内存上的分配,提高程序的运行效率。所以capacity的值会大于等于size,而不是代表当前string的实际大小。
? ? ? ? 查看Gcc关于string的capacity的代码,大致如下:
分配通过_M_mutate实现,_M_mutate再调用_M_create,调用实际的分配策略。
_M_mutate():
_M_create():
_M_max_size()如下:
???????可以看到,当所要扩容后的capacity如果大于_M_max_size,会抛出异常。这里不展开关注,只需要关注在正常可以扩容的情况下的capacity的变化。如果所要扩容后的capacity大于老的capacity,则进行二倍的的扩展。这就是Gcc的分配策略。
MSVC通过_Calculate_growth()完成capacity的扩容处理。代码如下:
? ? ? ? _ALLOC_MASK,为15,这个值是在编译期确定的值。
????????每次capacity分配都会将需要将string的请求长度_Requested与_Alloc_Mask进行或运算,得到一个_Requested加上一个<=15的值_Masked,如果该值大于_Max,则最大分配为_Max,不会像Gcc先抛出异常。
????????然后将该值与旧值大小的1/2增长进行比较,取两者的较大的值为新的capacity。
????????测试思路,先定义一个空的string,查看初始的capacity值,然后做10次扩容测试,查看每次扩容后的capacity情况。
测试代码如下:
#include <iostream>
#include <string>
using namespace std;
int main()
{
std::string str;
std::cout<<"origin capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;
for (int i = 0; i < 10; i++)
{
auto cap = str.capacity();
while(str.size() <= cap)
{
str.append("1");
}
std::cout<<"capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;
}
return 0;
}
????????可以看出,一个空的string的capacity初始值系统分配为15,然后再扩容后,后面每次capacity的大小为size/2 + size
Linux下为一个空的string分配的初始capacity也是15,后面每次进行扩容,都是当前(size/2)*2。
????????MSVC的扩容要小于Gcc下的扩容大小,这决定了在Linux下string进行不断进行增大时,效率要优于Windows,分配的频率会小于Windows。但是Linux下分配会占用的内存大于Windwos环境,这也可以理解,因为Linux本身运行的程序多为企业级多并发的大程序,利用Linux高资源的特点,可以用空间换时间,获得更快的运行效率。而Windows下运行的多为单机程序,运行的程序不像Linux环境下那么庞大,也不需要极致的空间置换时间,且Wndows的系统资源比较有限,这样可以在保证程序高效运行的情况下,兼顾系统资源在多程序之间的合理分配。