vector
是典型的模版实现,类的声明里包含一个参数是模版参数,第二个参数中出现了一个Alloc
,这个我们以后会讲,现在先不说。大家只需要知道,Alloc
是STL中六大组件中的其中一个,也就是空间配置器,本质就是一个内存池。
vector
是一个可以动态增长的数组实现的顺序容器。就像数组一样,vector
也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector
的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
vector
分配空间策略:vector
会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。因此,vector
占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
与其它动态序列容器相比(deque
, list
and forward_list
), vector
在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。
使用STL的三个境界:能用,明理,能扩展 ,那么下面学习vector,我们也是按照这个方法去学习。
(constructor)构造函数声明 | 接口说明 |
---|---|
vector()(重点) | 无参构造 |
vector(size_type n, const value_type& val = value_type()) | 构造并初始化n个val |
vector (const vector& x); (重点) | 拷贝构造 |
vector (InputIterator first, InputIterator last) | 使用迭代器进行初始化构造 |
void test1_vector()
{
vector<int> v1;
vector<int> v2(10, 0); // 初始化给10个0
vector<int> v3(v2.begin(), v2.end()); // 使用v2的迭代器初始化v3
string str("hello world");
vector<char> v4(str.begin(), str.end()); // 不只可以用vector的迭代器初始化
vector<char> v5(v4); // 拷贝构造
for (size_t i = 0; i < v3.size(); i++)
{
cout << v3[i] << " "; // 使用了重载[]
}
cout << endl;
vector<char>::iterator it = v4.begin(); // 使用迭代器遍历
while (it != v4.end())
{
cout << *it << " ";
++it;
}
cout << endl;
for (auto ch : v5)
{
cout << ch << " ";
}
cout << endl;
}
输出:
0 0 0 0 0 0 0 0 0 0
h e l l o w o r l d
h e l l o w o r l d
容量空间 | 接口说明 |
---|---|
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize(重点) | 改变vector的size |
reserve (重点) | 改变vector的capacity |
测试环境为VS2022:
// 测试vector的默认扩容机制
void TestVectorExpand()
{
size_t sz;
vector<int> v;
sz = v.capacity();
cout << "making v grow:\n";
for (int i = 0; i < 100; ++i)
{
v.push_back(i);
if (sz != v.capacity())
{
sz = v.capacity();
cout << "capacity changed: " << sz << '\n';
}
}
}
输出:
making v grow:
capacity changed: 1
capacity changed: 2
capacity changed: 3
capacity changed: 4
capacity changed: 6
capacity changed: 9
capacity changed: 13
capacity changed: 19
capacity changed: 28
capacity changed: 42
capacity changed: 63
capacity changed: 94
capacity changed: 141
发现VS下的扩容机制大概为扩1.5倍。如果把同样的代码放到g++的环境下编译,结果就是2倍扩容。
注意几个容易出错的点:
1)想要提前开空间应该严格使用reserve
,而不能使用resize
。来看这样一段代码:
void TestVectorExpand()
{
size_t sz;
vector<int> v;
v.resize(100); // resize(100)
sz = v.capacity();
cout << "making v grow:\n";
for (int i = 0; i < 100; ++i)
{
v.push_back(i);
if (sz != v.capacity())
{
sz = v.capacity();
cout << "capacity changed: " << sz << '\n';
}
}
}
此时,push_back
插入数据是从100的位置开始向后插入的,这就很坑了。所以当我们执行这段代码时发现,v
仍然会扩容,输出:(resize
还会将数据初始化成0)
making v grow:
capacity changed: 150
capacity changed: 225
2)不正确的初始化:
void test2_vector()
{
vector<int> v;
v.reserve(100); // size = 0;
for (size_t i = 0; i < v.size(); i++)
v[i] = i;
}
我们的预期是用1到100初始化v
,但是这段代码达不到预期效果,也不会崩溃。因为虽然v
的capacity
改变了,但是size
仍然是0,所以循环压根就不会进去。
还有一个缩容接口:
他的作用就是在capacity
比size
大时,将capacity
缩小为size
,实现缩容。但是这种缩容一般都是异地缩容,是一种以时间换空间的做法,一般不会用。
这些接口都比较简单,这里就简单的说一说。
operator[]
在出现一些越界访问的错误时,会直接报错,终止程序。at
在遇到越界访问问题时,会抛异常,而不会直接终止掉程序。front
就是访问头部元素,back
就是访问尾部元素。
vector增删查改 | 接口说明 |
---|---|
push_back(重点) | 尾插 |
pop_back (重点) | 尾删 |
find | 查找。(注意这个是算法模块实现,不是vector的成员接口) |
insert | 在position之前插入val |
erase | 删除position位置的数据 |
swap | 交换两个vector的数据空间 |
operator[] | (重点) 像数组一样访问 |
find
在这里是算法库中的函数,vector
类内没有提供。find
是用模版的方式实现的,使用于各种SLT容器,除了string
。有两个原因,一是string
出现的比较早;二是string
中find
的需求不一样,需要查找一个字符,或者查找一串字符。
template<class InputIterator, class T>
InputIterator find (InputIterator first, InputIterator last, const T& val)
{
while (first!=last) {
if (*first==val) return first;
++first;
}
return last;
}
前两个参数是迭代器类型,第三个参数是需要查找的数据,返回值也是迭代器类型数据。作用是在一个迭代器区间内,查找数据val
。如果找不到就返回last
,找到了就返回first
。
insert的用法:
iterator insert(iterator position, const value_type& val);
的作用是在pos位置前插入数据val
(pos是迭代器类型数据)。void insert(iterator position, size_type n, cosnt value_type& val);
的作用是在pos位置前插入n个数据。最后一个函数作用是在pos位置前,插入一段迭代器区间的数据。
vector插入的代码演示:
void test3_vector()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
for (auto x : v)
{
cout << x << " ";
}
cout << endl;
v.insert(v.begin(), 0);
for (auto x : v)
{
cout << x << " ";
}
cout << endl;
auto it = find(v.begin(), v.end(), 3);
if (it != v.end()) // 判断是否找到
{
v.insert(it, 30);
}
for (auto x : v)
{
cout << x << " ";
}
cout << endl;
}
输出;
1 2 3 4
0 1 2 3 4
0 1 2 30 3 4
erase的用法:
iterator erase(iterator position);
作用是删除pos位置的数据,pos是迭代器类型的数据;iterator erase(iterator first, iterator last);
作用是删除一段迭代器区间内的数据。
void test4_vector()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
for (auto x : v)
cout << x << " ";
cout << endl;
auto it = find(v.begin(), v.end(), 3);
if (it != v.begin())
v.erase(it);
for (auto x : v)
cout << x << " ";
cout << endl;
}
输出:
1 2 3 4
1 2 4
clear的作用:
clear
只是清空数据,它会将size
改成0,而不会改变capacity
。如果我们也想改变capacity
也将其置零,需要配合shrink_to_fit
使用。
void test5_vector()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.clear();
v.shrink_to_fit();
cout << v.capacity() << endl;
cout << v.size() << endl;
}
输出:
0
0
emplace和emplace_back:
这两个函数我们现在看不懂,先不用了解。只需要了解,emplace
的作用跟insert
一样,emplace_back
的作用跟push_back
一样。
建议先看完insert
和erase
的模拟实现再跳过来看迭代器失效问题。
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector
的迭代器就是原生态指针T*
。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。
对于vector
可能导致迭代器失效的操作有:
resize
、reserve
、insert
、assign
、push_back
等。erase
。与vector
类似,string
在插入,扩容操作,erase
之后,迭代器也会失效:
void TestString()
{
string s("hello");
auto it = s.begin();
// 放开之后代码会崩溃,因为resize到20会string会进行扩容
// 扩容之后,it指向之前旧空间已经被释放了,该迭代器就失效了
// 后序打印时,再访问it指向的空间程序就会崩溃
//s.resize(20, '!');
while (it != s.end())
{
cout << *it;
++it;
}
cout << endl;
it = s.begin();
while (it != s.end())
{
it = s.erase(it);
// 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
// it位置的迭代器就失效了
// s.erase(it);
++it;
}
}
解决办法:在使用之前,对迭代器重新赋值即可。
leetcode只出现一次的数字:https://leetcode.cn/problems/single-number/
class Solution {
public:
int singleNumber(vector<int>& nums)
{
int val = 0;
for(auto e : nums)
{
val ^= e;
}
return val;
}
};
leetcode杨辉三角:https://leetcode.cn/problems/pascals-triangle/description/
class Solution {
public:
vector<vector<int>> generate(int numRows)
{
vector<vector<int>> ret;
ret.resize(numRows);
for(int i = 0; i < numRows; i++)
{
ret[i].resize(i + 1, 0); // 开空间,赋初始值0
ret[i][0] = ret[i][ret[i].size() - 1] = 1; // 头尾的值是1
}
for(int i = 0; i < numRows; i++)
{
for(int j = 0; j < ret[i].size(); j++)
{
if(ret[i][j] == 0)
ret[i][j] = ret[i - 1][j] + ret[i - 1][j - 1];
}
}
return ret;
}
};
这里要理解一个东西:vectoe<vector<int>>
vector<vector<int>>
中_a指向的内容是一个一个的vector<int>
,而vector<int>
的_a指向的才是int类型的数据。相当于一个二维数组,访问的方式和C语言中二维数组的访问相同,都是用两个[]
,但是原理上有很大差别。
template <class T, class Alloc = alloc>
class vector {
public:
typedef T value_type;
typedef value_type* iterator;
typedef const value_type* const_iterator;
iterator start;
iterator finish;
iterator end_of_storage;
}
库中vector
的迭代器是用指针实现的,类型是value_type*
,实际上就是T*
。
其中,控制有效区间和防止越界的参数是start
、finish
和end_of_storage
,三者的类型都是迭代器类型,也就是指针。start
指向空间开始的位置,finish
指向有效区间的后一个位置,end_of_storage
指向开辟空间的末尾。(左闭右开)
namespace LHY
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
// 迭代器
iterator begin() { return _start; }
iterator end() { return _finish; }
const_iterator begin() const { return _start; }
const_iterator end() const { return _finish; }
// capacity和size
size_t capacity() { return _endofstorage - _start; }
size_t size() { return _finish - _start; }
vector()
:_start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{}
~vector()
{
delete[] _start;
_start = _finish = _endofstorage = nullptr;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
这些函数都没什么要说的,都很简单,大家看一看,熟练掌握。只需要注意一点:对于左闭右开的区间,有效数据个数size
就等于_finish - _start
;容量capacity
就等于_endofstorage - _start
。
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void push_back(const T& x)
{
if (_finish == _endofstorage)
{
size_t sz = size(); // size提前记录
size_t cp = capacity() == 0 ? 4 : capacity() * 2;
T* tmp = new T[cp];
if (_start) // 判断顺序表是否为空,不为空要进行拷贝
{
memcpy(tmp, _start, sizeof(T) * sz);
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + cp;
}
*_finish = x;
++_finish;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
注意:
size
需要提前记录,更新_finish
时不能写成_finish = _start + size()
。因为size
等于_endofstorage - _start
,而此时_start
已经更新了,_endofstorage - start
就是一个不能确定的结果,所以我们要将size
提前记录。cp
时,要判断一下capacity()
是否等于0,因为等于0的情况我们要单独处理。_start
是否为空,不为空要进行数据的拷贝。namespace LHY
{
template<class T>
class vector
{
public:
// ...
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
这个也没什么要强调的,大家熟练掌握。
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void reserve(size_t n)
{
if (n > capacity())
{
T* tmp = new T[n];
size_t sz = size();
if (_start)
{
memcpy(tmp, _start, sizeof(T) * sz);
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
// void resize(size_t, T val = T())
void resize(size_t n, const T& val = T())
{
if (n <= size())
{
_finish = _start + n;
}
else
{
reserve(n);
while (_finish < _start + n)
{
*_finish = val;
++_finish;
}
}
}
void push_back(const T& x)
{
if (_finish == _endofstorage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;
++_finish;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
注意:
1.reserve
实现的逻辑和我们第一次写push_back
扩容的逻辑是一样的,只不过要加上一点,判断一下n
是否大于capacity
,不大于capacity
就不做处理。
2.有了reserve
,就可以改造push_back
,在push_back
中复用reserve
即可。
3.resize
的第二个参数要写成 T val = T()
或const T& val = T()
,这两种写法本质上是一样的。基本的思想就是写一个缺省参数,=
右边是一个匿名参数。T val = T()
这句代码的逻辑是先调构造函数生成一个匿名对象,再调拷贝构造函数深拷贝给val
,不过编译器一般会优化为直接调用构造函数构造val
;const T& val = T()
的逻辑是const
延长匿名对象的生命周期,切记不能不带const
。
为什么使用匿名对象?设想,数据类型T
可能是int
,可能是double
,甚至可能是vector<int>
,等等,我们如何将这些情况都考虑进去呢?最好的办法就是匿名参数,这样执行T()
这段代码时,就可以调用T
类型对应的默认构造函数。
有同学可能会问,int
,double
这种内置类型也有默认构造函数吗?答案是有的,在模版出现以后,C++语法进行了升级,各种内置类型都有了自己的默认构造函数。这也体现了一切皆对象的思想,只不过C++不是纯粹的面向对象,它也兼容C语言,也体现面向过程。我们来验证一下:
// 一切皆对象
void test()
{
int i = 1;
int j(1);
int k = int(1);
double b = double();
cout << i << "\n" << j << "\n" << k << "\n" << b << endl;
}
输出:
1
1
1
0
4.resize
中,如果n <= size()
,直接缩减有效数据空间即可,也就是将_finish
改动一下,本质充当的是删除的作用。若n > size()
,则要将默认参数val
填充进去,在这之前,最好先reserve
一下,保证开辟的空间够用。
上面所写的
reserve
在遇到string
时会出问题,后面再说。
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void insert(iterator pos, const T& x)
{
assert(pos >= _start);
assert(pos <= _finish);
// 涉及迭代器失效 -- 内部失效
if (_finish == _endofstorage)
{
size_t len = pos - _start; // 记录偏移量
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len; // 更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
注意:
1.如果我们将纪录偏移量和更新pos
的两段代码注释掉,pos
会变成野指针。这是因为扩容后,pos
指向原来的空间,被释放掉了,而end
指向的是新空间,二者根本就没法进行比较。
2.insert
涉及迭代器失效。看一段代码:
int main()
{
LHY::vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
LHY::vector<int>::iterator it = v.begin() + 2;
v.insert(it, 30);
// 之后这个it还能不能用?
return 0;
}
如果我们设置了一个迭代器it
,在insert
后,it
还能不能使用?答案是不能。因为我们不知道当前vector
在插入数据后是否发生了扩容,如果发生了扩容,那么insert
后,it
指向的就是被释放的原空间,it
就失效了。
用insert来实现push_back:
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void push_back(const T& x)
{
insert(end(), x);
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
注意: erase也涉及迭代器失效。
研究下面的代码:
void test3()
{
LHY::vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
// v中的数据是1 2 3 4 5
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
// 删除偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
v.erase(it);
}
++it;
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
输出:
1 2 3 4 5
1 3 5
发现达到了预期效果,那如果将数组v
初始化成1 2 3 4 5 6
呢?或者2 2 3 4 5
呢?
发现,数组为1 2 3 4 5 6
时直接报错。为2 2 3 4 5
时输出的结果为2 3 5
,显然不满足预期,这是为何?
1)我们先来研究下2 2 3 4 5
的情况。
最开始,it
指向首元素2,_finish
指向5的后一个位置。(此处所说的it
是测试函数中的it
,不是erase
函数中的it
)。发现第一个元素为2是偶数后,删除该位置的元素,将第二个元素的值赋给了第一个元素,后续元素整体向前移一位,随后++it
,_finish--
。
随后判断it
位置的值是不是偶数,再进行相关操作。分析到这里相信大家已经发现问题了,有一个偶数被漏掉了,所以我们整个逻辑其实是有问题的。
2)再来研究下1 2 3 4 5 6
的情况。
这种情况其实前面都没有问题,直到it
指向最后一个元素6,就会出问题。
此时刚刚成功删除元素4,it
指向了最后一个元素6,_finish
指向最后一个元素的后一个位置。判断发现6是偶数,但是此时erase
函数中的循环并不会进去,不发生数据挪动,会直接将_finish--
,让6数据无效,随后++it
。
可以发现_finish
和it
完美错过,测试函数中的循环条件it != v.end()
永远满足,再次进入erase
函数,触发assert
,发生越界。
综上,可以说1 2 3 4 5
满足预期的情况纯属是个意外,所以我们认为,erase
函数会引发迭代器失效,使用时应格外注意。
不同的环境下结果不同:
如果上述代码在VS
环境下运行,会全部报错。
// 1 2 3 4 5 报错
// 2 2 3 4 5 报错
// 1 2 3 4 5 6 报错
我们虽然是在VS下写的代码,但是我们的设计风格是和g++
一样的,没有用std::vector<int> v;
,如果用了将全部报错,大家可以自行尝试。VS
有一个特点,它会强制检查,如果执行了一次erase
,就不让再++it
了(测试函数中的it
)。
如果上述代码在Linux
下运行,和我们分析的结果是一样的。
// 1 2 3 4 5 达到预期
// 2 2 3 4 5 结果错误
// 1 2 3 4 5 6 报错
那么该如何解决erase和insert的迭代器失效问题呢?让我们再来仔细看一看这两个函数的介绍:
可以发现,这两个函数其实是有返回值的,erase
返回的是删除数据的下一个位置,insert
返回的是新插入的第一个数据的位置。
正确实现insert和erase:
namespace LHY
{
template<class T>
class vector
{
public:
// ...
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start);
assert(pos <= _finish);
// 涉及迭代器失效 -- 内部失效
if (_finish == _endofstorage)
{
size_t len = pos - _start; // 记录偏移量
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len; // 更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
iterator erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
正确使用erase和insert:
void test3()
{
LHY::vector<int> v;
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
// 删除偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.erase(it);
}
else
{
++it;
}
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
insert
的返回值一般用不到。
一定要用之前模拟实现的push_back
。
测试一段代码:
void test4()
{
LHY::vector<string> v;
v.push_back("111111111111111111");
v.push_back("111111111111111111");
v.push_back("111111111111111111");
v.push_back("111111111111111111");
// v.push_back("111111111111111111"); 一会再放开
for (auto e : v)
cout << e << endl;
}
输出:
111111111111111111
111111111111111111
111111111111111111
111111111111111111
放开上面代码的注释,发现程序出错,输出:
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
111111111111111111
前四行出现乱码,这是为什么?我们大胆猜测一下,问题可能出在reserve
扩容上。通过调试发现,在代码执行到reserve
中的delete
后,乱码出现了。
其实,问题就出在memcpy
这个函数上,是深层次的浅拷贝问题,借助一个图来说明:
_start
指向的空间中,存放着4个string
类型的数据,其中4个string
类数据的_str
分别指向4块存放着字符串的空间。由于最开始v数组的容量是4,所以在执行第5个push_back
时,需要先进行扩容。先是开辟了一块新的更大的空间给tmp
,然后再用memcpy
将原有空间的数据拷贝给tmp
,此时问题出现了。在拷贝的过程中,memcpy
以逐字节的方式将原空间中的_str
,_size
,_capacity
都给了tmp
,导致tmp前4个string
类数据的_str
也指向原空间所指向的内容。在delete
时,会将新旧空间一并释放,出现乱码。
如何解决问题?
只需要改造一下扩容,赋值运算符即可:
namespace LHY
{
template<class T>
class vector
{
public:
// ...
void reserve(size_t n)
{
if (n > capacity())
{
T* tmp = new T[n];
size_t sz = size();
if (_start)
{
// memcpy(tmp, _start, sizeof(T) * sz); 不能用
for (int i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
tmp
是内置类型,=
就是一个普通的赋值。tmp
是自定义类型,=
就是一个赋值重载,无论如何都是深拷贝。
namespace LHY
{
template<class T>
class vector
{
public:
// capacity和size
size_t capacity() const { return _endofstorage - _start; }
size_t size() const { return _finish - _start; }
// ...
vector(const vector<T>& v)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(v.capacity());
for (auto& e : v)
push_back(e);
}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
vector<T>& operator=(vector<T> tmp) // vector& operator=(vector tmp)
{
swap(tmp);
return *this;
}
// ...
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
注意:
capacity
函数必须为const
成员函数,否则拷贝构造函数无法使用。从这一点可以看出,capacity
和size
函数定义为const
成员函数比较好,以便一些const
类型使用。vector<T>
中的<T>
可以去掉,但是不建议大家去掉。类名不是类型,在类里面可以直接写类名。namespace LHY
{
template<class T>
class vector
{
public:
vector() {} // 默认构造函数,不能不写
// 使用迭代器区间初始化
template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_back(*first);
++first;
}
}
// 使用n个val初始化
vector(size_t n, const T& val = T())
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}
// ...
private:
iterator _start = nullptr;
iterator _finish = nullptr;
iterator _endofstorage = nullptr;
};
}
注意:
测试一段代码:
void test5()
{
// LHY::vector<int> v2(10, 0); 放开后报错
LHY::vector<string> v1(10, "xxx");
for (size_t i = 0; i < v1.size(); i++)
{
cout << v1[i] << " ";
}
cout << endl;
}
放开注释的那段代码后程序报错,提示非法的间接寻址,这是为什么?
这是因为编译器在执行LHY::vector<int> v2(10, 0);
这句代码时,匹配到了用迭代器区间初始化的构造函数。我们来具体分析一下,LHY::vector<int> v2(10, 0);
如果要进行实例化,走vector(InputIterator first, InputIterator last)
,那它就会实例化出一个vector(int firse, int last)
函数;如果走vector(size_t n, const T& val = T())
,就会实例化出一个vector(size_t n, const int& val = int())
函数,还要进行整形提升。显然,这句代码和用迭代器区间初始化的构造函数更匹配。
那为什么LHY::vector<string> v1(10, "xxx");
可以编过呢?因为10和xxx这两个实参的类型就不一样,只能走vector(size_t n, const T& val = T())
。
为了解决这个问题,我们只能写一个比vector(InputIterator first, InputIterator last)
更适合LHY::vector<int> v2(10, 0);
的构造函数,这个构造函数如下:
namespace LHY
{
template<class T>
class vector
{
public:
// ...
vector(int n, const T& val = T())
{
reserve(n);
for (int i = 0; i < n; i++)
{
push_back(val);
}
}
// ...
private:
iterator _start = nullptr;
iterator _finish = nullptr;
iterator _endofstorage = nullptr;
};
}
这个构造函数的两个形参对于LHY::vector<int> v2(10, 0);
来说,T
是int
,那么vector(int n, const T& val = T())
的两个形参就直接是int
类型,跟LHY::vector<int> v2(10, 0);
完美匹配。
#pragma once
#include<assert.h>
#include<iostream>
using namespace std;
namespace LHY
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
// 迭代器
iterator begin() { return _start; }
iterator end() { return _finish; }
const_iterator begin() const { return _start; }
const_iterator end() const { return _finish; }
// capacity和size
size_t capacity() const { return _endofstorage - _start; }
size_t size() const { return _finish - _start; }
vector()
:_start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{}
template <class InputIterator>
vector(InputIterator first, InputIterator last)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
while (first != last)
{
push_back(*first);
++first;
}
}
vector(size_t n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}
vector(int n, const T& val = T())
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(n);
for (int i = 0; i < n; i++)
{
push_back(val);
}
}
vector(const vector<T>& v)
: _start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(v.capacity());
for (auto& e : v)
push_back(e);
}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
vector<T>& operator=(vector<T> tmp)
{
swap(tmp);
return *this;
}
~vector()
{
delete[] _start;
_start = _finish = _endofstorage = nullptr;
}
void reserve(size_t n)
{
if (n > capacity())
{
T* tmp = new T[n];
size_t sz = size();
if (_start)
{
// memcpy(tmp, _start, sizeof(T) * sz); 不能用
for (int i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
void resize(size_t n, const T& val = T())
{
if (n <= size())
{
_finish = _start + n;
}
else
{
reserve(n);
while (_finish < _start + n)
{
*_finish = val;
++_finish;
}
}
}
void push_back(const T& x)
{
//if (_finish == _endofstorage)
//{
// //size_t sz = size(); // size提前记录
// //size_t cp = capacity() == 0 ? 4 : capacity() * 2;
// //T* tmp = new T[cp];
// //if (_start) // 判断顺序表是否为空,不为空要进行拷贝
// //{
// // memcpy(tmp, _start, sizeof(T) * sz);
// // delete[] _start;
// //}
// //_start = tmp;
// //_finish = _start + sz;
// //_endofstorage = _start + cp;
// reserve(capacity() == 0 ? 4 : capacity() * 2);
//}
//*_finish = x;
//++_finish;
insert(end(), x);
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start);
assert(pos <= _finish);
// 涉及迭代器失效 -- 内部失效
if (_finish == _endofstorage)
{
size_t len = pos - _start; // 记录偏移量
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len; // 更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
/*void erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
}*/
iterator erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
题目链接:https://leetcode.cn/problems/letter-combinations-of-a-phone-number/
class Solution
{
const char* numStrArr[10] = {"", "", "abc", "def", "ghi", "jkl", "mno", "pqrs", "tuv", "wxyz"};
public:
void Combine(const string& digits, int i, string combineStr, vector<string>& ret)
{
if (i == digits.size())
{
ret.push_back(combineStr);
return;
}
int num = digits[i] - '0';
string str = numStrArr[num]; // 取到数字对应的字符串
for (auto ch : str)
{
Combine(digits, i + 1, combineStr + ch, ret);
}
}
vector<string> letterCombinations(const string& digits)
{
vector<string> v; // 返回的字符串数组
if (digits.empty())
return v; // 当digits为空时返回数组
string combineStr; // 完成组合的字符串
Combine(digits, 0, combineStr, v);
return v;
}
};