在2003年C++标准委员会曾经提交了一份技术勘误表(简称TC1),使得C++03这个名字已经取代了C++98称为C++11之前的最新C++标准名称。不过由于C++03(TC1)主要是对C++98标准中的漏洞进行修复,语言的核心部分则没有改动,因此人们习惯性的把两个标准合并称为C++98/03标准。从C++0x到C++11,C++标准10年磨一剑,第二个真正意义上的标准珊珊来迟。相比于C++98/03,C++11则带来了数量可观的变化,其中包含了约140个新特性,以及对C++03标准中约600个缺陷的修正,这使得C++11更像是从C++98/03中孕育出的一种新语言。相比较而言,C++11能更好地用于系统开发和库开发、语法更加泛华和简单化、更加稳定和安全,不仅功能更强大,而且能提升程序员的开发效率,公司实际项目开发中也用得比较多,所以我们要作为一个重点去学习。
在C++98中,标准允许使用花括号{}对数组或者结构体元素进行统一的列表初始值设定。比如:
struct Point
{
int _x;
int _y;
};
int main()
{
int array1[] = { 1,2,3,4,5 };
int array2[5] = { 0 };
struct Point p = { 1,2 }; //_x=1 _y=2
cout << p._x << endl;
cout << p._y << endl;
return 0;
}
在C++11扩大了用大括号括起的列表(初始化列表)的使用范围,使其可用于所有的内置类型和用户自定义的类型,使用初始化列表时,可添加等号(=),也可不添加。
struct Point
{
int _x;
int _y;
};
int main()
{
int x1 = 1;
int x2 = { 2 };
//可以省略赋值符号
int x3{ 3 };
int array1[]{ 1,2,3,4,5 };
int array2[5]{ 0 };
struct Point p { 1, 2 };
cout << array1[2] << endl;
cout << p._x << endl;
cout << p._y << endl;
//c++11中列表初始化也可以适用于new表达式中
int* pa = new int[4]{ 0 };
cout << pa[2] << endl;
return 0;
}
对于自定义类型,当创建对象时也可以适用列表初始化方式调用构造函数初始化。
class Date
{
public:
Date(int year, int month, int day)
:_year(year),_month(month),_day(day)
{
cout << "Date(int year, int month, int day)" << endl;
}
private:
int _year;
int _month;
int _day;
};
int main()
{
Date d1(2023, 12, 22); //原始的方法,调用构造函数进行初始化
//c++11支持的列表初始化,这里会调用构造函数初始化。
Date d2{ 2023,11,11 }; //省略赋值符号=
Date d3 = { 2023,10,10 };
return 0;
}
STL中的容器也可以使用列表初始化。
c++11中通过添加一个新的类型,std::initializer_list类型来使STL中的容器也可以使用列表初始化。
所以我们上面将STL中的容器使用列表初始化,其实是调用了这些容器的一个构造函数。在c++11中对STL中的不少容器就增加std::initializer_list作为参数的构造函数,这样初始化容器对象就更方便了。
std::initializer_list也可以作为operator=的参数,这样就可以用大括号赋值。
map可以这样初始化是因为map容器支持initializer_list< pair >构造函数。而pair可以这样用是因为pair也支持initializer_list构造函数。
将以前写的vector也增加std::initializer_list作为参数的构造函数
c++11提供了多种简化声明的方式,尤其是在使用模板时。
在C++98中auto是一个存储类型的说明符,表明变量是局部自动存储类型,但是局部域中定义局部的变量默认就是自动存储类型,所以auto就没什么价值了。C++11中废弃auto原来的用法,将其用于实现自动类型推断。这样要求必须进行显示初始化,让编译器将定义对象的类型设置为初始化值的类型。
关键字decltype将变量的类型声明为表达式指定的类型。
用橘色圈起来是C++11中的一些几个新容器,但是实际最有用的是unordered_map和
unordered_set。这两个我们前面已经进行了非常详细的讲解,其他的大家了解一下即可。
传统的C++语法中就有引用的语法,而C++11中新增了的右值引用语法特性,所以从现在开始我们之前学习的引用就叫做左值引用。无论左值引用还是右值引用,都是给对象取别名。
什么是左值?什么是左值引用?
左值是一个表示数据的表达式(如变量名或解引用的指针),我们可以获取它的地址+可以对它赋值,左值可以出现赋值符号的左边,右值不能出现在赋值符号左边。定义时const修饰符后的左值,不能给他赋值,但是可以取它的地址。左值引用就是给左值的引用,给左值取别名。
什么是右值?什么是右值引用?
右值也是一个表示数据的表达式,如:字面常量、表达式返回值,函数返回值(这个不能是左值引用返回)等等,右值可以出现在赋值符号的右边,但是不能出现出现在赋值符号的左边,右值不能取地址。右值引用就是对右值的引用,给右值取别名。
需要注意的是右值是不能取地址的,但是给右值取别名后,会导致右值被存储到特定位置,且可以取到该位置的地址,也就是说例如:不能取字面量10的地址,但是rr1引用后,可以对rr1取地址,也可以修改rr1。如果不想rr1被修改,可以用const int&& rr1 去引用。
左值引用总结:
右值引用总结:
虽然使用const左值引用也可以引用右值。但是如果函数定义使用const左值引用为参数,然后调用时传入一个右值当作这个函数的参数的话,那么这个函数就不知道传进来的是左值还是右值了。
前面我们可以看到左值引用既可以引用左值和又可以引用右值,那为什么C++11还要提出右值引用呢?下面我们来看看左值引用的短板,右值引用是如何补齐这个短板的。
namespace dong
{
class string
{
public:
typedef char* iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
string(const char* str = "")
:_size(strlen(str))
, _capacity(_size)
{
//cout << "string(char* str)" << endl;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
// s1.swap(s2)
void swap(string& s)
{
::swap(_str, s._str);
::swap(_size, s._size);
::swap(_capacity, s._capacity);
}
// 拷贝构造
string(const string& s)
:_str(nullptr)
{
cout << "string(const string& s) -- 深拷贝" << endl;
string tmp(s._str);
swap(tmp);
}
// 赋值重载
string& operator=(const string& s)
{
cout << "string& operator=(string s) -- 深拷贝" << endl;
string tmp(s);
swap(tmp);
return *this;
}
~string()
{
delete[] _str;
_str = nullptr;
}
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void push_back(char ch)
{
if (_size >= _capacity)
{
size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;
reserve(newcapacity);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
//string operator+=(char ch)
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string operator+(char ch)
{
string tmp(*this);
tmp += ch;
return tmp;
}
const char* c_str() const
{
return _str;
}
private:
char* _str;
size_t _size;
size_t _capacity; // 不包含最后做标识的\0
};
}
int main()
{
dong::string s1("hello world");
dong::string ret1 = s1;
dong::string ret2 = (s1 + '!');
return 0;
}
上面是我们实现的一个简单的string类,在main函数中,s1+'!‘为一个右值,但是因为string类中没有相匹配的以右值引用为参数的函数,所以s1+’!’会先通过拷贝构造函数创建一个新的对象,然后通过运算符+的重载函数将这个新对象返回,这一共进行了两次深拷贝。但是在运算符+的重载函数中return tmp时,会先调用拷贝构造函数创建一个临时的对象,并且将tmp的内容拷贝到这个临时对象中,然后将这个临时对象返回。这是因为tmp为函数内的对象,当出了函数作用域后就销毁了,所以需要再次调用拷贝构造函数将tmp的数据带出来返回给mian函数。
但是如果我们使用了移动构造的话,就可以将运算符+的重载函数中的return tmp时的拷贝构造函数省去。编译器在指向return tmp时,会将tmp当作一个右值进行处理,然后就会调用移动构造函数,移动构造函数会将tmp的资源转移给ret2,这样就不需要再调用一次拷贝构造函数重新创建一个对象返回给ret2了。这样做就完成了对tmp资源的复用。
右值分为两种,纯右值就是内置类型,例如字面常量10等,a+b等。将亡值就是自定义类型的右值,例如上面的tmp对象,当出了函数作用域后就会消亡。
当一个自定义类型对象已经为将亡值时,并且此时还需要使用这个对象的数据,如果使用深拷贝再创建一个对象的话那么开销太大。所以就可以直接将这个将亡值的资源进行转移。
使用拷贝构造函数的情况。
使用移动构造的情况。
左值可能以后还会用,所以不能将左值的资源转移给其它对象使用。但是右值为将亡值,以后不再使用,所以可以将这个右值的资源转移给另一个相同类型的对象。当为右值时,下面的两个函数都可以调用,但是编译器会调用最匹配的那一个函数,所以会调用移动构造。因为在运算符+的重载函数中,执行return tmp时,编译器会经过特殊处理将tmp识别为右值,这样当调用拷贝构造函数时,发现有更合适的移动构造,所以就会调用移动构造。
如果一个左值不想使用了,就可以通过move来将这个左值的资源转移给其它对象使用。使用move就相当于将s1的权限变为可以被别人将资源掠夺走。
我们知道左值引用可以直接减少拷贝,即可以通过左值引用传参和传引用返回来直接减少拷贝。但是函数内的局部对象不能用传引用返回。因为出了函数作用域该对象就不存在了,就不能使用左值引用返回,只能传值返回。例如:dong::string to_string(int value)函数中可以看到,这里只能使用传值返回,那么传值返回会导致至少1次拷贝构造(如果是一些旧一点的编译器可能是两次拷贝构造)。
如果在dong::string中增加移动构造,移动构造本质是将参数右值的资源窃取过来,占位已有,那么就不用做深拷贝了,所以它叫做移动构造,就是窃取别人的资源来构造自己。
不仅仅有移动构造,还有移动赋值:
在dong::string类中增加移动赋值函数,再去调用dong::to_string(1234),不过这次是将dong::to_string(1234)返回的右值对象赋值给ret1对象,这时调用的是移动构造。
这里运行后,我们看到调用了一次移动构造和一次移动赋值。因为如果是用一个已经存在的对象接收,编译器就没办法优化了。dong::to_string函数中会先用str拷贝构造生成一个临时对象,但是我们可以看到,编译器很聪明的在这里把str识别成了右值,调用了移动构造。然后再把这个临时对象做为dong::to_string函数调用的返回值赋值给ret1,这里调用的移动赋值。
如果没有移动赋值的话会调用一次拷贝构造,一次拷贝赋值。
而如果有移动赋值的话,就会调用一次移动构造,调用一次移动赋值。
在c++11以后,STL中所有的容器都增加了移动构造函数和移动赋值函数。这样的话就可以使c++的性能得到进一步提升,即可以少执行深拷贝。
并且在c++11以后,STL中的所有容器的插入数据接口函数都增加了右值引用版本。
按照语法,右值引用只能引用右值,但右值引用一定不能引用左值吗?因为:有些场景下,可能真的需要用右值去引用左值实现移动语义。当需要用右值引用引用一个左值时,可以通过move函数将左值转化为右值。C++11中,std::move()函数位于 头文件中,该函数名字具有迷惑性,它并不搬移任何东西,唯一的功能就是将一个左值强制转化为右值引用,然后实现移动语义。
下面就是通过move函数将左值s1转为右值引用,这样调用list容器的push_back函数时,就会调用右值引用版本了。
我们可以看到如果调用右值引用版本的接口函数,那么就会直接进行资源转移,而不是调用拷贝构造函数再重新深拷贝创建一个对象。
在平常写代码时,我们应该注意不要使用move函数,因为move函数会将当前对象的资源变得可以被分配。我们可以创建一个匿名对象,因为匿名对象是右值,
总结
左值引用可以减少拷贝,提高效率。
右值引用也可以减少拷贝,提高效率。
但是它们的角度不同,左值引用直接减少拷贝。
右值引用是间接减少拷贝,识别出是左值还是右值,如果是右值,则不再深拷贝,而是直接移动资源,提高效率。
左值引用和右值引用都是给对象取别名,减少拷贝。
虽然左值引用解决了大多数场景的拷贝问题,但是还有左值引用没有解决的问题:1.局部对象返回问题。2.插入接口,对象拷贝问题。所以c++11中才添加了右值引用来进一步减少拷贝
模板中的&&不代表右值引用,而是万能引用,其既能接收左值又能接收右值。
void Fun(int& x)
{
cout << "左值引用" << endl;
}
void Fun(const int& x)
{
cout << "const 左值引用" << endl;
}
void Fun(int&& x)
{
cout << "右值引用" << endl;
}
void Fun(const int&& x)
{
cout << "const 右值引用" << endl;
}
//万能引用(引用折叠):既可以引用左值,也可以引用右值
template<typename T>
void PerfectForward(T&& t)
{
Fun(t);
}
int main()
{
PerfectForward(10); //右值
int a;
PerfectForward(a); //左值
PerfectForward(move(a)); //右值
return 0;
}
我们可以看到在PerfectForward中调用Fun函数,都是左值引用。这是因为右值引用经过引用后,属性变为了左值。这样才能实现转移资源。所以才看到调用的Fun函数都是左值引用。
为什么右值引用在函数中就会属性变为了左值呢?这是因为只有属性变为了左值,右值引用才可以实现资源转移。
但是这样也会造成一个问题。当在右值引用为参数的函数中调用另一个右值引用为参数的函数时,此时并不会自动调用右值引用函数,而是调用左值引用函数,这是因为右值引用经过引用后,属性变为了左值。即模板的万能引用只是提供了能够接收同时接收左值引用和右值引用的能力,但是引用类型的唯一作用就是限制了接收的类型,后续使用中都退化成了左值,我们希望能够在传递过程中保持它的左值或者右值的属性, 就需要用我们下面学习的完美转发。
std::forward 完美转发在传参的过程中保留对象原生类型属性。我们看到这样的话右值引用经过引用后还可以保持自己的右值属性了。
下面我们来看一个完美转发实际中的使用场景,我们将以前实现的list类中加上右值引用的接口函数。
当我们没有添加右值引用版本的接口函数时,可以看到调用的都是拷贝构造函数。
下面我们给list类中的insert接口函数和push_back接口函数都添加右值引用版本的重载函数。
但是我们运行时发现还是调用的拷贝构造函数,这其实是因为在调用lt对象的push_back函数时,右值引用x经过引用后,属性变为了左值。所以会调用list类中参数为左值引用的insert函数,并不会调用参数为右值引用的参数。
这时就可以使用完美转发来解决这样的问题。即在push_back中使用std::forward保留对象x的右值属性。
然后我们发现还是调用的拷贝构造函数。这是因为在list类中的insert函数中还调用了list_node类中的构造函数,而这个构造函数没有右值引用版本的构造函数,那么当走到这里时就会调用dong::string的拷贝构造函数了。
所以我们将list_node类中的构造函数也添加一个右值引用版本的构造函数。并且我们需要将上面的每一层都使用std::forward函数来保留对象的右值属性,这样当需要调用dong::string的拷贝构造函数时,编译器发现该对象为右值,然后就会调用更匹配的移动构造函数了。
然后我们看到此时调用lt对象的push_back函数时,就会使用右值引用版本的函数来添加元素了,这样就减少了拷贝构造函数的调用。
原来C++类中,有6个默认成员函数:
最重要的是前4个,后两个用处不大。默认成员函数就是我们不写编译器会生成一个默认的。在C++11后新增了两个:移动构造函数和移动赋值运算符重载函数。
针对移动构造函数和移动赋值运算符重载有一些需要注意的点如下:
如果你没有自己实现移动构造函数,且没有实现析构函数 、拷贝构造、拷贝赋值重载中的任意一个。那么编译器会自动生成一个默认移动构造。默认生成的移动构造函数,对于内置类型成员会执行逐成员按字节拷贝,自定义类型成员,则需要看这个成员是否实现移动构造,如果实现了就调用移动构造,没有实现就调用拷贝构造。
如果你没有自己实现移动赋值重载函数,且没有实现析构函数 、拷贝构造、拷贝赋值重载中的任意一个,那么编译器会自动生成一个默认移动赋值。默认生成的移动构造函数,对于内置类型成员会执行逐成员按字节拷贝,自定义类型成员,则需要看这个成员是否实现移动赋值,如果实现了就调用移动赋值,没有实现就调用拷贝赋值。(默认移动赋值跟上面移动构造完全类似)
如果你提供了移动构造或者移动赋值,编译器不会自动提供拷贝构造和拷贝赋值.
我们看到对于新添加的两个默认成员函数,编译器自动生成的条件变得更多了。即当没有实现析构函数 、拷贝构造、拷贝赋值重载中的任意一个时,编译器才会自动生成移动构造函数和移动赋值运算符重载函数。这是因为它认为如果你自己实现了析构函数、拷贝构造函数、拷贝赋值重载函数的任意一个,那么这个类中就有涉及到深拷贝的地方,即这个类就是一个深拷贝的类,所以此时移动构造就不知道对于深拷贝的类该怎么处理,所以就不会自动生成了。还需要注意的是,移动构造函数也算拷贝构造函数的重载函数,所以当实现了移动构造函数后,编译器就不会再自动生成拷贝构造函数了,对于移动赋值运算符重载函数和赋值运算符重载函数也是类似。
我们看到下面的Person类中,我们没有实现拷贝构造等函数,然后我们看到调用了我们自己实现的string类的移动构造函数,这说明编译器自己生成了移动构造函数和移动赋值运算符重载函数。然后编译器生成的移动构造函数对move(s1)进行移动拷贝时,会调用s1对象的移动构造函数。
当我们实现了Person类的析构函数 、拷贝构造、拷贝赋值重载中的任意一个后,就破坏了编译器自动生成移动构造函数的条件,此时编译器就不会自动生成移动构造函数了。
下面我们使用编译器自动生成的移动赋值运算符重载函数。我们看到该函数是将s2对象和s4对象的资源进行了互换。
C++11可以让你更好的控制要使用的默认函数。假设你要使用某个默认的函数,但是因为一些原因这个函数没有默认生成。比如:我们提供了拷贝构造,就不会生成移动构造了,那么我们可以使用default关键字显示指定编译器生成移动构造函数。即default关键字就是强制生成默认函数的关键字。
我们看到下面的Person类中,虽然实现了析构函数,但是我们使用default关键字强制生成移动构造函数和移动赋值运算符重载函数。这里我们强制生成拷贝构造函数是因为如果有了移动构造函数,编译器就不会自动生成拷贝构造函数了,那么s2=s1就没有可用的拷贝构造函数了,所以我们强制生成拷贝构造函数。
如果想要限制某些默认函数的生成,在C++98中,是将该函数设置成private,并且只声明,这样只要其他人想要调用就会报错。在C++11中更简单,只需在该函数声明加上=delete即可,该语法指示编译器不生成对应函数的默认版本。即delete关键字为禁止生成默认函数的关键字。
如果一个类不希望被拷贝,那么就可以将这个类的拷贝构造函数使用delete关键字修饰。
委托构造语法可以使一个构造函数复用其它构造函数。
C++11的新特性可变参数模板能够让您创建可以接受可变参数的函数模板和类模板,相比C++98/03,类模版和函数模版中只能含固定数量的模版参数,可变模版参数无疑是一个巨大的改进。然而由于可变模版参数比较抽象,使用起来需要一定的技巧,所以这块还是比较晦涩的。现阶段呢,我们掌握一些基础的可变参数模板特性就够我们用了,所以这里我们点到为止,以后大家如果有需要,再可以深入学习。
下面就是一个基本可变参数的函数模板
//Args是一个模板参数包,args是一个函数形参参数包
//声明一个参数包Args...args,这个参数包中可以包含0到任意个模板参数
template<class ...Args>
void ShowList(Args... args)
{
}
我们看到当调用ShowList函数时可以传入任意类型,任意数量的参数,都可以正常调用ShowList函数。并且我们可以使用sizeof…这样的语法来求出一个函数的参数包中参数的个数,
上面的参数args前面有省略号,所以它就是一个可变模版参数,我们把带省略号的参数称为“参数包”,它里面包含了0到N(N>=0)个模版参数。我们无法直接获取参数包args中的每个参数的,只能通过展开参数包的方式来获取参数包中的每个参数,这是使用可变模版参数的一个主要特点,也是最大的难点,即如何展开可变模版参数。由于语法不支持使用args[i]这样方式获取可变参数,所以我们的用一些奇招来一一获取参数包的值。
递归函数方式展开参数包
void ShowList()
{
cout << endl;
}
//Args是一个模板参数包,args是一个函数形参参数包
//声明一个参数包Args...args,这个参数包中可以包含0到任意个模板参数
template<class T, class ...Args>
void ShowList(const T& val, Args... args)
{
cout << val << " ";
ShowList(args...);
}
int main()
{
ShowList();
ShowList('x');
ShowList('x', 'y');
ShowList('x', 1.1);
ShowList(2.2, 'A', std::string("test"));
return 0;
}
这样做其实是使用递归的思维来使每一次调用ShowList函数时,将参数包中的第一个参数作为ShowList函数的第一个参数val。
例如当执行ShowList()时,此时会直接调用特化函数ShowList();
当执行ShowList(‘x’)时,此时参数包args中的参数为0,然后在模板生成的ShowList函数中,第一个参数val就为’x’,所以会打印出x。然后将args作为参数再传入ShowList函数中,因为此时参数包中参数为0,所以会调用特化函数ShowList。
当执行ShowList(2.2,‘A’,std::string(“test”))时,会先调用模板生成的ShowList函数,然后2.2作为ShowList函数的第一个参数val,'A’和string对象在参数包中。然后打印出来2.2后递归调用ShowList(args…),此时参数包中只有两个参数’A’和string对象,所以’A’就会为ShowList函数的第一个参数val,然后参数包中就只有string对象了。然后打印出来’A’后,再次递归调用ShowList函数,此时参数包只有一个参数,所以ShowList函数的第一个参数就为string对象了,然后打印出来string对象的内容。然后再次递归调用ShowList函数,此时参数包中已经没有参数了,所以会调用特化函数ShowList打印空行。
我们可以通过下面的代码查看每一次递归调用ShowList函数时,参数包args中参数的个数。
除了上面的递归方式外,还有一个逗号表达式展开参数包的方法。
逗号表达式展开参数包
这种展开参数包的方式,不需要通过递归终止函数,是直接在expand函数体中展开的, PrintArg不是一个递归终止函数,只是一个处理参数包中每一个参数的函数。这种就地展开参数包的方式实现的关键是逗号表达式。我们知道逗号表达式会按顺序执行逗号前面的表达式。
expand函数中的逗号表达式:(PrintArg(args), 0),也是按照这个执行顺序,先执行PrintArg(args),再得到逗号表达式的结果0。同时还用到了C++11的另外一个特性——初始化列表,通过初始化列表来初始化一个变长数组, {(PrintArg(args), 0)…}将会展开成((PrintArg(args1),0), (PrintArg(args2),0), (PrintArg(args3),0), etc… ),最终会创建一个元素值都为0的数组int arr[sizeof…(Args)]。由于是逗号表达式,在创建数组的过程中会先执行逗号表达式前面的部分PrintArg(args)打印出参数,也就是说在构造int数组的过程中就将参数包展开了,这个数组的目的纯粹是为了在数组构造的过程展开参数包。当编译器想要知道arr数组开多大时,就需要先执行推导args参数包的内容,PrintArg(args)…不是将整个参数包传给PrintArg函数,而是参数包有多少参数,就会调用多少次PrintArg函数,所以就会每一个参数都调用一层PrintArg函数,这样就得到了参数包中的参数。然后再执行逗号表达式将0初始化给arr数组。
因为在VS中不支持变长数组,所以我们使用g++编译器来编译。
上面的写法中,如果PrintArg函数中的返回值没有用的话,还可以将上面写法中去掉逗号表达式,然后让PringArg函数的返回值置为0,这样当执行完该函数后返回的0就可以作为初始化数组arr的值了。
c++11以后,对STL容器的插入接口函数都提供了一个emplace系列的插入函数。我们看到的emplace系列的接口,支持模板的可变参数,并且万能引用,这样的话调用emplace系列接口函数时传入左值或右值都可以。
例如emplace_back接口函数中的参数包为万能引用,传左值就为左值属性,调用string的深拷贝;传右值就为右值属性,调用string的移动构造。而push_back中有左值引用版本,也有右值引用版本,如果调用push_back传入的为左值,就调用这个左值的拷贝构造函数,如果传入的为右值,就调用这个右值的移动构造。
通过上面的演示我们看到容器的push_back接口函数和emplace系列接口函数好像没有什么区别,即在插入对象时都调用对象同样的函数。但是当我们使用下面的形式向容器中插入对象时,就会有很大的区别了。我们将自己实现的string类的构造函数中加上一句打印。
我们可以通过注释掉push_back或注释掉emplace_back来得到下面的结果,即调用push_back函数时调用了string类的构造函数和移动拷贝函数,但是调用emplace_back函数插入元素时只调用了string类的直接构造函数,我们发现emplace_back接口函数少调用了一次移动构造函数。
这是因为push_back只支持左值引用版本和右值引用版本,所以就会先将字符串"3333"隐式类型转换为string类型,即会中间生成一个临时对象,这会调用一次string类的构造函数,然后调用string类的移动构造函数转移这个临时对象的资源。所以在调用push_back函数插入元素时,向下传递的是一个string类型的对象。
但是emplace_back的参数为参赛包,参数包中可以为任意类型,所以不会进行将字符串"3333"隐式类型转换为string类型,而是直接以const char * 类型向后传递。然后将这个const char * 类型的参数向下传递。最后当创建结点时,才将const char * 类型作为string类的构造函数的参数,来创建一个string对象。
但是我们可以看到这样形式的插入对象emplace系列函数只是比push_back函数少调用了一次移动构造函数,而我们知道移动构造函数只是移动资源,所以调用移动构造函数的消耗非常小。
在C++98中,如果想要对一个数据集合中的元素进行排序,可以使用std::sort方法。例如像下面一样。但是随着C++语法的发展,人们开始觉得上面的写法太复杂了,每次为了实现一个algorithm算法,都要重新去写一个类,如果每次比较的逻辑不一样,还要去实现多个类,特别是相同类的命名,这些都给编程者带来了极大的不便。因此,在C++11语法中出现了Lambda表达式。
lambda表达式书写格式:[capture-list] (parameters) mutable -> return-type { statement }
[capture-list] : 捕捉列表,该列表总是出现在lambda函数的开始位置,编译器根据[]来判断接下来的代码是否为lambda函数,捕捉列表能够捕捉上下文中的变量供lambda函数使用。
(parameters):参数列表。与普通函数的参数列表一致,如果不需要参数传递,则可以连同()一起省略
mutable:默认情况下,lambda函数总是一个const函数,mutable可以取消其常量性。使用该修饰符时,参数列表不可省略(即使参数为空)。
->returntype:返回值类型。用追踪返回类型形式声明函数的返回值类型,没有返回值时此部分可省略。返回值类型明确情况下,也可省略,由编译器对返回类型进行推导。
{statement}:函数体。在该函数体内,除了可以使用其参数外,还可以使用所有捕获到的变量。
注意:在lambda函数定义中,参数列表和返回值类型都是可选部分,而捕捉列表和函数体可以为空。因此C++11中最简单的lambda函数为:[]{}; 该lambda函数不能做任何事情。
下面就为一个简单的求两个数之和的lambda表达式。
如果返回值明确的情况下,也可以将返回值进行省略。但是建议不要省略。
下面我们来将上面写的两个仿函数改为使用lambda表达式。可以看到使用lambda表达式来代替仿函数的写法更简便了。
lambda表达式中的捕捉列表可以捕捉到它所在的作用域里面的变量。
下面我们使用lambda表达式实现一个swap函数。
然后我们再使用lambda的捕捉列表来实现swap。
我们看到报出了错误,这是因为lambda函数总是一个const函数,而使用mutable修饰可以取消其常量性。下面我们加上mutable修饰这个lambda表达式。但是我们看到在lambda表达式中并没有将x和y的值进行交换。
这是因为我们使用的是传值捕捉,传值捕捉是将外面的x、y拷贝一份到lambda函数体中,所以在lambda函数体中改变的是拷贝的x和y的值,而外面作用域中x和y的值并没有改变。所以我们应该使用传引用捕捉,需要注意的是在lambda表达式的捕捉列表中,&x不是取地址,而是传引用捕捉。
在lambda表达式的捕捉列表中还可以混合捕捉,还可以全部传引用捕捉,还可以全部传值捕捉
捕捉列表描述了上下文中那些数据可以被lambda使用,以及使用的方式传值还是传引用。
[var]:表示值传递方式捕捉变量var
[=]:表示值传递方式捕获所有父作用域中的变量(包括this)
[&var]:表示引用传递捕捉变量var
[&]:表示引用传递捕捉所有父作用域中的变量(包括this)
[this]:表示值传递方式捕捉当前的this指针
注意:
a. 父作用域指包含lambda函数的语句块。
b. 语法上捕捉列表可由多个捕捉项组成,并以逗号分割。
比如:[=, &a, &b]:以引用传递的方式捕捉变量a和b,值传递方式捕捉其他所有变量。
[&,a, this]:值传递方式捕捉变量a和this,引用方式捕捉其他变量。
c. 捕捉列表不允许变量重复传递,否则就会导致编译错误。
比如:[=, a],=已经以值传递方式捕捉了所有变量,再捕捉a就会重复。
d. 在块作用域以外的lambda函数捕捉列表必须为空。
e. 在块作用域中的lambda函数仅能捕捉父作用域中局部变量,捕捉任何非此作用域或者非局部变量都会导致编译报错。
f. lambda表达式之间不能相互赋值,即使看起来类型相同。
在c++11之前,使用c++写一个linux和windows下都可以支持的多线程程序,需要使用条件编译。因为linux下和windows下的线程接口不相同,所以需要使用条件编译进行判断,如果在windows下就调用windows系统提供的线程接口;如果在linux下就调用linux系统提供的线程接口。就像下面的伪代码类似。
在c++11中增加了线程库,这样再使用c++编写多线程程序时,就可以直接调用c++11中提供的thread库里面的函数了,而不需要考虑兼容系统的问题了。因为这些事情c++11在底层帮我们实现了,我们只需调用c++底层封装过的thread库里面的函数即可。
下面我们使用thread库里面的函数来创建线程。在thread类使用模板生成的构造函数中,第一个参数fn为一个可以调用的对象即可,例如函数指针、仿函数、lambda对象等。第二个参数为一个参数包,即为这个线程的回调函数的参数,因为使用了参数包,所以这个线程的回调函数的参数为几个都可以。
上面的实现线程调用回调函数的写法与我们在linux时写的类似,下面我们来使用c++11中的lambda表达式,将线程的回调函数使用lambda表达式的形式给出。我们看到可以直接在创建线程对象时使用lambda对象作为thread对象要执行的函数。
我们可以感觉到上面的代码存在冗余性。即两个lambda对象中就n1和n2的值不同,所以我们通常采用下面的写法来创建多个线程。
vthds(m)的意思是创建m个线程对象在vector中,因为vector中有一个构造参数是这样的,即如果不给存的类型的缺省值,那么会调用其默认构造函数,所以vthds(m)就会创建m个线程对象,并且每个线程对象调用thread的默认构造函数来创建。
然后vthds[i] = thread…的意思。thread为一个匿名对象,所以为一个将亡值,而thread支持移动赋值运算符重载函数,所以vthds[i]=匿名对象。因为匿名对象为右值,所以会调用thread的移动赋值运算符重载函数,将这个匿名对象的资源给vector里面对应的thread对象,即将这个匿名对象中的的lambda表达式里面的函数给vector里面的thread对象。
函数对象,又称为仿函数,即可以像函数一样使用的对象,就是在类中重载了operator()运算符的类对象。
我们从下面的使用方式上来看,函数对象与lambda表达式完全一样。函数对象将rate作为其成员变量,在定义对象时给出初始值即可,而lambda表达式通过捕获列表可以直接将该变量捕获到。
我们可以看到仿函数和lambda底层汇编指令类似,都是先根据类的构造函数生成一个对象,然后再调用这个对象的operator()操作符重载函数。即当使用lambda表达式时,编译器会使用模板自动生成一个类,然后将lambda对象的函数体中的内容作为这个类的operator()函数的重载。这个自动生成的类的名称为lambda_+uuid,其中uuid是通用唯一识别码,就类似于一串唯一的字符串。这样我们写的lambda表达式其实就被编译器处理为函数对象了。这样当编译器底层执行lambda表达式时和执行仿函数是一样的。这个就类似范围for和迭代器的关系,即编译器底层只有迭代器,而不知道范围for。所以lambda和范围for一样都是上层玩法,其实底层实现还是c++之前的东西。
所以我们就理解了lambda对象不能相互赋值的原因。因为它们两个的类型不同,即生成的uuid不同,所以根据这两个lambda生成的类的名字就不同,所以不同类型之间的对象不能相互赋值。
在c++11中提供了线程库。即可以直接通过实例化一个thread对象来创建一个线程,并且可以调用thread类的成员函数来获取当前线程的id、等待线程、分离线程等操作。
但是这样就存在了一个问题,即只能创建thread对象后才能调用该thread对象的get_id成员函数来获取当前线程的id。但是这样我们在线程的回调函数中就不能调用get_id函数了。因为此时thread对象还没有实例化出来。
所以c++11为thread库中提供了一个this_thread,this_thread为一个命名空间,该命名空间中提供了一个全局的get_id函数。即哪个线程执行这个函数就打印哪个线程的id。
我们还看到this_thread命名空间中还提供了两个让线程休眠的函数,并且还有一个yield函数,调用这个函数可以让线程主动让出时间片。yield函数让出时间片,即例如当哈希桶中,两个线程同时向一个桶内插入结点时,因为一个线程执行时可能要进行哈希表扩容,所以会浪费很长时间。而这时另一个线程不能使用这个桶,但是这个线程还是会占用CPU来尝试进行CAS操作,这样做是浪费性能的。所以此时第二个线程就可以调用yield函数来让出时间片,即等一段时间后再来占用CPU进行CAS操作。无锁编程用的比较多,无锁编程是少用锁,不是绝对不用锁。
下面我们可以了解一下无锁编程中的CAS。CAS[cpu硬件同步原语(compare and swap)],CAS也叫做比较与交换,是一种无锁原子算法,映射到操作系统就是一条cmpxchg硬件汇编指令,通过硬件命令保证了原子性。其作用是让CPU将内存值更新为新值,但是有个条件,内存值必须与期望值相同。CAS操作无需用户态和内核态切换,直接在用户态对内存进行读写操作,这意味着不会进行上下文切换。
它包含3个参数CAS(V,E,N),V表示待更新的内存值,E表示预期值,N表示新值,当V值等于E值时,才会将V值更新成N值,如果V值和E值不等,操作失败或者重新再来,这就是一次CAS的操作。
简单说,CAS需要你额外给出一个期望值,也就是你认为这个变量现在应该是什么样子的,如果变量不是你想象的那样,说明它已经被别人修改过了,你只需要重新读取,设置期望值,再次尝试修改就好了。
设置一个期望值的目的:通过内存值与期望值的比较,防止自己的修改覆盖了别人的修改。
CAS文章链接
我们可以看到i+=1的操作在汇编语言中其实执行了三个指令,而在这三个指令中间有可能线程就会进行切换,所以如果有多个线程同时对同一个变量进行++时,这是线程不安全的。此时我们可以通过加互斥锁的方式来保证线程安全。
我们还可以通过第二种方法来保证上面i+=1的操作为线程安全的。即我们可以通过CAS原子性操作来将i+=1这个操作变为原子操作,这样只有当前线程执行完i+=1后下一个线程才能修改i的值。linux中的原子性接口为下面的函数。CAS即为操作系统底层提供的可以保证原子性的一个操作。CAS可以比较两个值并且将两个值进行交换,而且可以保证这个操作是原子性的。下面的接口函数的意思为将i作为待更新的内存值给这个接口,old表示预期值,old+1表示新值。当有多个线程执行这个函数时,因为这个具有原子性,当一个线程执行时发现i和old相同,然后执行CAS将i变为新值old+1(注意,这个接口会直接将i的值换为old+1),然后返回true。然后后面再来一个线程执行这个接口,发现i的值为1,和预期值old不相同,就不会再执行将i和old+1交换了,然后返回false,进入循环中,让这个线程的old=i,既让old=1,然后这个线程再次执行时发现此时i和old的值相同,于是执行CAS将i变为old+1,即将i变为2。这个接口就是先判断第一个参数和第二个参数是否相同,如果相同就将第一个参数和第三个参数交换,然后返回true。如果第一个参数和第二个参数不相同,那么就返回false。
compare_and_swap接口的内部实现类似下面这样。
我们可以使用CAS来实现一个无锁队列,具体实现可以看下面这篇文章。
酷壳-无锁队列的实现
c++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,c++11引入的原子操作类型,使得线程间数据的同步变得非常高效。
在c++11中还有一个atomic模板类,使用这个模板生成的类就不需要进行加锁来保证其线程安全了。
我们看到当对x对象进行并发++操作时,并没有出现线程安全问题,这是因为atomic< int >类型的对象执行的++等操作为原子操作,所以不会出现线程安全问题。
当我们打印对象x的值时不能直接打印,因为x为自定义类型,而%d是内置类型int的占位符,所以不支持。需要调用x的load函数来获取容器中的值。
下面我们来使用两个线程同时修改同一个全局变量x。我们看到当线程执行的++x的次数变多后,就会出现线程安全问题,我们看到最后x并没有为30000。
所以此时我们就需要对++x这个操作进行加锁。c++11中提供了mutex类,可以通过实例化一个mutex对象来作为一个锁。
下面我们创建了一个互斥锁,并且对++x操作进行了加锁。我们看到此时这个程序就没有线程安全问题了。
我们除了给++x这个操作加锁之外,我们还可以直接给for循环进行加锁。并且我们看到当给for循环进行加锁时,程序的效率更高。这是因为第一种写法需要频繁的进行申请锁和释放锁,还需要一直切换线程上下文,即采用并行的方式执行。而第二种写法是直接先将一个线程执行完毕,再执行另一个线程,即采用串行的方式执行。所以第二种写法不需要进行频繁的申请锁和释放锁,也不需要频繁的切换线程上下文。
我们看到当我们在for循环中加入打印的操作时,我们看到第一种并行的写法比第二种串行的写法效率要高,这是因为打印为IO操作,所以就会需要进行等待,而在等待的这段时间中,第一种写法可以切换到另一个线程执行,而第二种写法就只能进行IO等待。所以第一种写法比第二种写法的效率高。
在c++11中除了互斥锁之外还有递归锁,定时互斥锁等。
std::recursive_mutex
其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外,std::recursive_mutex 的特性和 std::mutex 大致相同。
std::timed_mutex
比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until() 。
try_lock_for()
接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
try_lock_until()
接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
下面的递归程序会出现线程安全问题。我们可以通过加一个互斥锁来保证这个程序的线程安全。
当我们将互斥锁加到下面的位置时就形成了死锁。而如果我们此时将互斥锁换为递归锁的话,那么就不会出现死锁的现象。
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制。但是锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。例如下面的代码这样。
此时我们可以实现一个LockGuard锁守卫,即当创建一个LockGuard对象时会自动调用构造函数来申请锁,而当这个LockGuard对象销毁时,会自动调用析构函数来将锁进行释放。这样就解决了上面在抛异常时没有释放锁的问题。
在c++11中已经为我们提供了lock_guard类模板,我们可以直接使用。
c++11中还提供了unique_lock,可以看到unique_lock比lock_guard多了lock、unlock等函数,即可以在中途进行释放锁和重新申请锁。
下面主要演示了condition_variable的使用,condition_variable我们在学习linux时已经了解过,他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别,主要还是面向对象实现的。
我们看到在使用条件变量的wait函数时需要传入一把锁,这是因为当在进行wait等待时,因为是阻塞等待,而如果此时这个阻塞线程拿着锁等待的话,那么可能就会造成死锁情况,所以wait函数中在阻塞等待之前会将传入的这个锁进行释放。
下面我们就来实现两个线程打印数字,一个打印奇数,一个打印偶数。我们让t1先打印奇数,然后再让t2打印偶数,那么我们就需要保证每一次都是t1先进行打印。下面的写法就可以保证每一次都是t1线程先运行。这里只有两种情况,第一种:t1先抢到锁,t2后抢到锁。t1先运行,t2阻塞在锁上面。第二种:t2先抢到锁,t1后抢到锁。t2先运行,t1阻塞在锁上面,但是t2会被wait阻塞住,并且阻塞前会将锁释放,这样t1就可以拿到锁向下执行了。所以下面的写法就可以保证t1先运行。
然后我们还要防止t1线程或t2线程一直打印。所以我们可以添加一个判断,在t1线程中当x为偶数时就不再打印,而是调用wait进行阻塞等待。在t2线程中当x为奇数时就不再打印,而是调用wait进行阻塞等待。并且t1线程或t2线程打印完后就调用notify_one函数来唤醒一个wait阻塞等待的线程。
上面的程序还存在线程安全问题,即当x为99时,t2判断x<n进入了循环中,然后切换到线程t1,此时x为99,
t1判断x<n进入了循环并且将x加加变为100,然后切换到t2,t2再进行x加加将x变为101。所以会出现线程安全问题。所以我们可以再进行判断,在t1中当x大于等于100时就进行break跳出循环,在t2中当x大于100时就跳出循环。
条件变量的wait函数中还有一个这样的重载函数。这个wait函数后面可以为一个可调用对象,当这个可调用对象返回false时就wait阻塞等待,当返回true时就不wait阻塞等待。
function包装器 也叫作适配器。C++中的function本质是一个类模板,也是一个包装器。那么我们来看看,我们为什么需要function呢?
我们看到下面的函数模板useF实例化了三份,因为模板参数F可能为函数指针,可能为仿函数对象,也可能为lambda表达式,这些都是可调用的类型。
如果我们想将上面的可调用类型都统一,我们就可以使用包装器来实现。
std::function在头文件<functional>
// 类模板原型如下
template <class T> function; // undefined
template <class Ret, class... Args>
class function<Ret(Args...)>;
模板参数说明:
Ret: 被调用函数的返回类型
Args…:被调用函数的形参
如果我们想要在一个容器中存可调用类型就可以使用包装器。包装器将这些可调用类型都封装为function类型的对象。
需要注意的是包装非静态成员函数,需要加&符号,静态成员函数也可以加&符号,非静态成员函数必须加。并且需要注意非静态成员函数需要多一个this参数,这里需要使用Plus。当使用对象时,调用func5时会调用该对象的plusd函数。当使用指针时,会调用这个指针指向的对象的plusd函数。如果使用Plus *的话,那么就只能使用左值了,而不能使用匿名对象,因为匿名对象为右值,不能取地址。
然后我们使用包装器来解决模板实例化多份的问题,我们可以看到下面函数模板只实例化了一次。包装器实际也是仿函数。包装器就是将可调用对象进行了封装。
下面我们可以通过一个逆波兰表达式的题来体会包装器的作用。我们可以在map容器中存放可调用对象,这个可调用对象可以是函数指针,仿函数对象,lambda表达式等,当需要加新的操作时,只需要在map容器中加一个对应的可调用对象就可以了。
std::bind函数定义在头文件中,是一个函数模板,它就像一个函数包装器(适配器),接受一个可调用对象(callable object),生成一个新的可调用对象来“适应”原对象的参数列表。一般而言,我们用它可以把一个原本接收N个参数的函数fn,通过绑定一些参数,返回一个接收M个(M可以大于N,但这么做没什么意义)参数的新函数。同时,使用std::bind函数还可以实现参数顺序调整等操作。
可以将bind函数看作是一个通用的函数适配器,它接受一个可调用对象,生成一个新的可调用对象来“适应”原对象的参数列表。
调用bind的一般形式:auto newCallable = bind(callable,arg_list);
其中,newCallable本身是一个可调用对象,arg_list是一个逗号分隔的参数列表,对应给定的callable的参数。当我们调用newCallable时,newCallable会调用callable,并传给它arg_list中的参数。
arg_list中的参数可能包含形如_n的名字,其中n是一个整数,这些参数是“占位符”,表示newCallable的参数,它们占据了传递给newCallable的参数的“位置”。数值n表示生成的可调用对象中参数的位置:_1为newCallable的第一个参数,_2为第二个参数,以此类推。
下面我们使用bind来调整函数的参数顺序和参数个数。