C++小白的逆袭之路——初阶(第九章:vector)

发布时间:2024年01月05日


1.vector的介绍和使用


1.1vector的介绍


在这里插入图片描述
vector是典型的模版实现,类的声明里包含一个参数是模版参数,第二个参数中出现了一个Alloc,这个我们以后会讲,现在先不说。大家只需要知道,Alloc是STL中六大组件中的其中一个,也就是空间配置器,本质就是一个内存池。

vector是一个可以动态增长的数组实现的顺序容器。就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。

vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。

与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。

使用STL的三个境界:能用,明理,能扩展 ,那么下面学习vector,我们也是按照这个方法去学习。


1.2vector的使用


1.2.1构造、拷贝构造函数


在这里插入图片描述

(constructor)构造函数声明接口说明
vector()(重点)无参构造
vector(size_type n, const value_type& val = value_type())构造并初始化n个val
vector (const vector& x); (重点)拷贝构造
vector (InputIterator first, InputIterator last)使用迭代器进行初始化构造
void test1_vector()
{
	vector<int> v1;
	vector<int> v2(10, 0);							// 初始化给10个0
	vector<int> v3(v2.begin(), v2.end());			// 使用v2的迭代器初始化v3

	string str("hello world");
	vector<char> v4(str.begin(), str.end());		// 不只可以用vector的迭代器初始化
	vector<char> v5(v4);							// 拷贝构造

	for (size_t i = 0; i < v3.size(); i++)
	{
		cout << v3[i] << " ";						// 使用了重载[]
	}
	cout << endl;

	vector<char>::iterator it = v4.begin();			// 使用迭代器遍历
	while (it != v4.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	for (auto ch : v5)
	{
		cout << ch << " ";
	}
	cout << endl;
}

输出:

0 0 0 0 0 0 0 0 0 0
h e l l o   w o r l d
h e l l o   w o r l d

1.2.2vector空间增长问题


容量空间接口说明
size获取数据个数
capacity获取容量大小
empty判断是否为空
resize(重点)改变vector的size
reserve (重点)改变vector的capacity

测试环境为VS2022:

// 测试vector的默认扩容机制
void TestVectorExpand()
{
	size_t sz;
	vector<int> v;
	sz = v.capacity();
	cout << "making v grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			sz = v.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

输出:

making v grow:
capacity changed: 1
capacity changed: 2
capacity changed: 3
capacity changed: 4
capacity changed: 6
capacity changed: 9
capacity changed: 13
capacity changed: 19
capacity changed: 28
capacity changed: 42
capacity changed: 63
capacity changed: 94
capacity changed: 141

发现VS下的扩容机制大概为扩1.5倍。如果把同样的代码放到g++的环境下编译,结果就是2倍扩容。

注意几个容易出错的点:

1)想要提前开空间应该严格使用reserve,而不能使用resize。来看这样一段代码:

void TestVectorExpand()
{
	size_t sz;
	vector<int> v;
	v.resize(100);				// resize(100)
	sz = v.capacity();
	cout << "making v grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			sz = v.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

此时,push_back插入数据是从100的位置开始向后插入的,这就很坑了。所以当我们执行这段代码时发现,v仍然会扩容,输出:(resize还会将数据初始化成0)

making v grow:
capacity changed: 150
capacity changed: 225

2)不正确的初始化:

void test2_vector()
{
	vector<int> v;
	v.reserve(100);			// size = 0;

	for (size_t i = 0; i < v.size(); i++)
		v[i] = i;
}

我们的预期是用1到100初始化v,但是这段代码达不到预期效果,也不会崩溃。因为虽然vcapacity改变了,但是size仍然是0,所以循环压根就不会进去。

还有一个缩容接口:

在这里插入图片描述

他的作用就是在capacitysize大时,将capacity缩小为size,实现缩容。但是这种缩容一般都是异地缩容,是一种以时间换空间的做法,一般不会用。


1.2.3vector元素的访问


在这里插入图片描述

这些接口都比较简单,这里就简单的说一说。

operator[]在出现一些越界访问的错误时,会直接报错,终止程序。at在遇到越界访问问题时,会抛异常,而不会直接终止掉程序。front就是访问头部元素,back就是访问尾部元素。


1.2.4vector增删查改


在这里插入图片描述

vector增删查改接口说明
push_back(重点)尾插
pop_back (重点)尾删
find查找。(注意这个是算法模块实现,不是vector的成员接口)
insert在position之前插入val
erase删除position位置的数据
swap交换两个vector的数据空间
operator[](重点) 像数组一样访问

find在这里是算法库中的函数,vector类内没有提供。find是用模版的方式实现的,使用于各种SLT容器,除了string。有两个原因,一是string出现的比较早;二是stringfind的需求不一样,需要查找一个字符,或者查找一串字符。

在这里插入图片描述

template<class InputIterator, class T>
	InputIterator find (InputIterator first, InputIterator last, const T& val)
{
  while (first!=last) {
    if (*first==val) return first;
    ++first;
  }
  return last;
}

前两个参数是迭代器类型,第三个参数是需要查找的数据,返回值也是迭代器类型数据。作用是在一个迭代器区间内,查找数据val。如果找不到就返回last,找到了就返回first

insert的用法:

在这里插入图片描述

iterator insert(iterator position, const value_type& val);的作用是在pos位置前插入数据val(pos是迭代器类型数据)。void insert(iterator position, size_type n, cosnt value_type& val);的作用是在pos位置前插入n个数据。最后一个函数作用是在pos位置前,插入一段迭代器区间的数据。

vector插入的代码演示:

void test3_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;

	v.insert(v.begin(), 0);

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;

	auto it = find(v.begin(), v.end(), 3);
	if (it != v.end())		// 判断是否找到
	{
		v.insert(it, 30);
	}

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;
}

输出;

1 2 3 4
0 1 2 3 4
0 1 2 30 3 4

erase的用法:

在这里插入图片描述

iterator erase(iterator position);作用是删除pos位置的数据,pos是迭代器类型的数据;iterator erase(iterator first, iterator last);作用是删除一段迭代器区间内的数据。

void test4_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	for (auto x : v)
		cout << x << " ";
	cout << endl;

	auto it = find(v.begin(), v.end(), 3);
	if (it != v.begin())
		v.erase(it);

	for (auto x : v)
		cout << x << " ";
	cout << endl;
}

输出:

1 2 3 4
1 2 4

clear的作用:

clear只是清空数据,它会将size改成0,而不会改变capacity。如果我们也想改变capacity也将其置零,需要配合shrink_to_fit使用。

void test5_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	v.clear();
	v.shrink_to_fit();

	cout << v.capacity() << endl;
	cout << v.size() << endl;
}

输出:

0
0

emplace和emplace_back:

这两个函数我们现在看不懂,先不用了解。只需要了解,emplace的作用跟insert一样,emplace_back的作用跟push_back一样。


1.2.5vector迭代器失效问题(重点)


建议先看完inserterase的模拟实现再跳过来看迭代器失效问题。

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。

对于vector可能导致迭代器失效的操作有:

  1. 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resizereserveinsertassignpush_back等。
  2. 指定位置元素的删除操作–erase

vector类似,string在插入,扩容操作,erase之后,迭代器也会失效:

void TestString()
{
	string s("hello");
	auto it = s.begin();
	
	// 放开之后代码会崩溃,因为resize到20会string会进行扩容
	// 扩容之后,it指向之前旧空间已经被释放了,该迭代器就失效了
	// 后序打印时,再访问it指向的空间程序就会崩溃
	//s.resize(20, '!');
	while (it != s.end())
	{
		cout << *it;
		++it;
	}
	cout << endl;
	
	it = s.begin();
	while (it != s.end())
	{
		it = s.erase(it);
		// 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
		// it位置的迭代器就失效了
		// s.erase(it);
		++it;
	}
}

解决办法:在使用之前,对迭代器重新赋值即可。


1.3一些练习题目


leetcode只出现一次的数字https://leetcode.cn/problems/single-number/

class Solution {
public:
    int singleNumber(vector<int>& nums) 
    {
        int val = 0;
        for(auto e : nums)
        {
            val ^= e;
        }
        return val;
    }
};

leetcode杨辉三角https://leetcode.cn/problems/pascals-triangle/description/

class Solution {
public:
    vector<vector<int>> generate(int numRows) 
    {
        vector<vector<int>> ret;
        ret.resize(numRows);

        for(int i = 0; i < numRows; i++)
        {
            ret[i].resize(i + 1, 0);                    // 开空间,赋初始值0
            ret[i][0] = ret[i][ret[i].size() - 1] = 1;  // 头尾的值是1
        }

        for(int i = 0; i < numRows; i++)
        {
            for(int j = 0; j < ret[i].size(); j++)
            {
                if(ret[i][j] == 0)
                    ret[i][j] = ret[i - 1][j] + ret[i - 1][j - 1];
            }
        } 

        return ret;
    }
};

这里要理解一个东西:vectoe<vector<int>>
在这里插入图片描述

vector<vector<int>>中_a指向的内容是一个一个的vector<int>,而vector<int>的_a指向的才是int类型的数据。相当于一个二维数组,访问的方式和C语言中二维数组的访问相同,都是用两个[],但是原理上有很大差别。


2.vector的模拟实现


2.1库中vector的核心


template <class T, class Alloc = alloc>
class vector {
public:
	typedef T value_type;
	typedef value_type* iterator;
	typedef const value_type* const_iterator;
	iterator start;
	iterator finish;
	iterator end_of_storage;
}	

库中vector的迭代器是用指针实现的,类型是value_type*,实际上就是T*

其中,控制有效区间和防止越界的参数是startfinishend_of_storage,三者的类型都是迭代器类型,也就是指针。start指向空间开始的位置,finish指向有效区间的后一个位置,end_of_storage指向开辟空间的末尾。(左闭右开)

在这里插入图片描述


2.2迭代器,构造,析构


namespace LHY
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		// 迭代器
		iterator begin() { return _start; }
		iterator end() { return _finish; }
		const_iterator begin() const { return _start; }
		const_iterator end() const { return _finish; }

		// capacity和size
		size_t capacity() { return _endofstorage - _start; }
		size_t size() { return _finish - _start; }

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		~vector()
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

这些函数都没什么要说的,都很简单,大家看一看,熟练掌握。只需要注意一点:对于左闭右开的区间,有效数据个数size就等于_finish - _start;容量capacity就等于_endofstorage - _start


2.3模拟实现push_back


namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...

		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				size_t sz = size();		// size提前记录
				size_t cp = capacity() == 0 ? 4 : capacity() * 2;
				T* tmp = new T[cp];
				if (_start)				// 判断顺序表是否为空,不为空要进行拷贝
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + cp;
			}

			*_finish = x;
			++_finish;
		}
		
		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意:

  1. size需要提前记录,更新_finish时不能写成_finish = _start + size()。因为size等于_endofstorage - _start,而此时_start已经更新了,_endofstorage - start就是一个不能确定的结果,所以我们要将size提前记录。
  2. 扩容记录cp时,要判断一下capacity()是否等于0,因为等于0的情况我们要单独处理。
  3. 需要判断_start是否为空,不为空要进行数据的拷贝。

2.4模拟实现operator[]


namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

这个也没什么要强调的,大家熟练掌握。


2.5reserve和resize


namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...
		
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		// void resize(size_t, T val = T())
		void resize(size_t n, const T& val = T())
		{
			if (n <= size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}

			*_finish = x;
			++_finish;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意:

1.reserve实现的逻辑和我们第一次写push_back扩容的逻辑是一样的,只不过要加上一点,判断一下n是否大于capacity,不大于capacity就不做处理。

2.有了reserve,就可以改造push_back,在push_back中复用reserve即可。

3.resize的第二个参数要写成 T val = T()const T& val = T(),这两种写法本质上是一样的。基本的思想就是写一个缺省参数,=右边是一个匿名参数。T val = T()这句代码的逻辑是先调构造函数生成一个匿名对象,再调拷贝构造函数深拷贝给val,不过编译器一般会优化为直接调用构造函数构造valconst T& val = T()的逻辑是const延长匿名对象的生命周期,切记不能不带const

为什么使用匿名对象?设想,数据类型T可能是int,可能是double,甚至可能是vector<int>,等等,我们如何将这些情况都考虑进去呢?最好的办法就是匿名参数,这样执行T()这段代码时,就可以调用T类型对应的默认构造函数。

有同学可能会问,intdouble这种内置类型也有默认构造函数吗?答案是有的,在模版出现以后,C++语法进行了升级,各种内置类型都有了自己的默认构造函数。这也体现了一切皆对象的思想,只不过C++不是纯粹的面向对象,它也兼容C语言,也体现面向过程。我们来验证一下:

// 一切皆对象
void test()
{
	int i = 1;
	int j(1);
	int k = int(1);
	double b = double();

	cout << i << "\n" << j << "\n" << k << "\n" << b << endl;
}

输出:

1
1
1
0

4.resize中,如果n <= size(),直接缩减有效数据空间即可,也就是将_finish改动一下,本质充当的是删除的作用。若n > size(),则要将默认参数val填充进去,在这之前,最好先reserve一下,保证开辟的空间够用。

上面所写的reserve在遇到string时会出问题,后面再说。


2.6模拟实现insert


namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
		}

		// ...
		
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意:

1.如果我们将纪录偏移量和更新pos的两段代码注释掉,pos会变成野指针。这是因为扩容后,pos指向原来的空间,被释放掉了,而end指向的是新空间,二者根本就没法进行比较。

2.insert涉及迭代器失效。看一段代码:

int main()
{
 	LHY::vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	
	LHY::vector<int>::iterator it = v.begin() + 2;
	v.insert(it, 30);
	// 之后这个it还能不能用?

	return 0;
}

如果我们设置了一个迭代器it,在insert后,it还能不能使用?答案是不能。因为我们不知道当前vector在插入数据后是否发生了扩容,如果发生了扩容,那么insert后,it指向的就是被释放的原空间,it就失效了。

用insert来实现push_back:

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void push_back(const T& x)
		{
			insert(end(), x);
		}

		// ...
		
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

2.7模拟实现erase


namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意: erase也涉及迭代器失效。

研究下面的代码:

void test3()
{
	LHY::vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	// v中的数据是1 2 3 4 5

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	// 删除偶数
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{
			v.erase(it);
		}
		++it;
	}

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

输出:

1 2 3 4 5
1 3 5

发现达到了预期效果,那如果将数组v初始化成1 2 3 4 5 6呢?或者2 2 3 4 5呢?

发现,数组为1 2 3 4 5 6时直接报错。为2 2 3 4 5时输出的结果为2 3 5,显然不满足预期,这是为何?

1)我们先来研究下2 2 3 4 5的情况。

在这里插入图片描述

最开始,it指向首元素2,_finish指向5的后一个位置。(此处所说的it是测试函数中的it,不是erase函数中的it)。发现第一个元素为2是偶数后,删除该位置的元素,将第二个元素的值赋给了第一个元素,后续元素整体向前移一位,随后++it_finish--

在这里插入图片描述

随后判断it位置的值是不是偶数,再进行相关操作。分析到这里相信大家已经发现问题了,有一个偶数被漏掉了,所以我们整个逻辑其实是有问题的。

2)再来研究下1 2 3 4 5 6的情况。

这种情况其实前面都没有问题,直到it指向最后一个元素6,就会出问题。

在这里插入图片描述

此时刚刚成功删除元素4,it指向了最后一个元素6,_finish指向最后一个元素的后一个位置。判断发现6是偶数,但是此时erase函数中的循环并不会进去,不发生数据挪动,会直接将_finish--,让6数据无效,随后++it

在这里插入图片描述

可以发现_finishit完美错过,测试函数中的循环条件it != v.end()永远满足,再次进入erase函数,触发assert,发生越界。

综上,可以说1 2 3 4 5满足预期的情况纯属是个意外,所以我们认为,erase函数会引发迭代器失效,使用时应格外注意。

不同的环境下结果不同:

如果上述代码在VS环境下运行,会全部报错。

// 1 2 3 4 5  		报错
// 2 2 3 4 5		报错
// 1 2 3 4 5 6		报错

我们虽然是在VS下写的代码,但是我们的设计风格是和g++一样的,没有用std::vector<int> v;,如果用了将全部报错,大家可以自行尝试。VS有一个特点,它会强制检查,如果执行了一次erase,就不让再++it了(测试函数中的it)。

如果上述代码在Linux下运行,和我们分析的结果是一样的。

// 1 2 3 4 5		达到预期
// 2 2 3 4 5		结果错误
// 1 2 3 4 5 6		报错

那么该如何解决erase和insert的迭代器失效问题呢?让我们再来仔细看一看这两个函数的介绍:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

可以发现,这两个函数其实是有返回值的,erase返回的是删除数据的下一个位置,insert返回的是新插入的第一个数据的位置。

正确实现insert和erase:

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
			return pos;
		}

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
			return pos;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

正确使用erase和insert:

void test3()
{
	LHY::vector<int> v;
	v.push_back(2);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.push_back(6);

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	// 删除偶数
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{
			it = v.erase(it);
		}
		else
		{
			++it;
		}
	}

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

insert的返回值一般用不到。


2.8vector遇到string时会出现的问题


一定要用之前模拟实现的push_back

测试一段代码:

void test4()
{
	LHY::vector<string> v;

	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	// v.push_back("111111111111111111");	一会再放开

	for (auto e : v)
		cout << e << endl;
}

输出:

111111111111111111
111111111111111111
111111111111111111
111111111111111111

放开上面代码的注释,发现程序出错,输出:

葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
111111111111111111

前四行出现乱码,这是为什么?我们大胆猜测一下,问题可能出在reserve扩容上。通过调试发现,在代码执行到reserve中的delete后,乱码出现了。

在这里插入图片描述

在这里插入图片描述

其实,问题就出在memcpy这个函数上,是深层次的浅拷贝问题,借助一个图来说明:

在这里插入图片描述

_start指向的空间中,存放着4个string类型的数据,其中4个string类数据的_str分别指向4块存放着字符串的空间。由于最开始v数组的容量是4,所以在执行第5个push_back时,需要先进行扩容。先是开辟了一块新的更大的空间给tmp,然后再用memcpy将原有空间的数据拷贝给tmp,此时问题出现了。在拷贝的过程中,memcpy以逐字节的方式将原空间中的_str_size_capacity都给了tmp,导致tmp前4个string类数据的_str也指向原空间所指向的内容。在delete时,会将新旧空间一并释放,出现乱码。

如何解决问题?

只需要改造一下扩容,赋值运算符即可:

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					// memcpy(tmp, _start, sizeof(T) * sz);		不能用
					for (int i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

tmp是内置类型,=就是一个普通的赋值。tmp是自定义类型,=就是一个赋值重载,无论如何都是深拷贝。


2.9模拟实现拷贝构造和赋值重载


namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// capacity和size
		size_t capacity() const { return _endofstorage - _start; }
		size_t size() const { return _finish - _start; }
		
		// ...

		vector(const vector<T>& v)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(v.capacity());
			for (auto& e : v)
				push_back(e);
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		vector<T>& operator=(vector<T> tmp) // vector& operator=(vector tmp)
		{
			swap(tmp);
			return *this;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意:

  1. capacity函数必须为const成员函数,否则拷贝构造函数无法使用。从这一点可以看出,capacitysize函数定义为const成员函数比较好,以便一些const类型使用。
  2. vector<T>中的<T>可以去掉,但是不建议大家去掉。类名不是类型,在类里面可以直接写类名。

2.10其他几种构造函数(非默认构造)


namespace LHY
{
	template<class T>
	class vector
	{
	public:

		vector() {}			// 默认构造函数,不能不写

		// 使用迭代器区间初始化
		template <class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		// 使用n个val初始化
		vector(size_t n, const T& val = T())
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}
		
		// ...

	private:
		iterator _start = nullptr;
		iterator _finish = nullptr;
		iterator _endofstorage = nullptr;
	};
}

注意:

  1. 类模版里面也可以嵌套模版。
  2. 为了简化代码,避免每写一个构造函数都要初始化三个成员变量,索性将成员变量在声明处给值。但是这样写带来一个问题,有同学可能认为既然在声明处初始化了,那自己就可以不写无参的构造函数了。这样的想法是错误的,因为只要我们写了任何一种形式的构造函数,编译器将不再生成默认构造函数,也就没有无参的构造函数。

测试一段代码:

void test5()
{
	// LHY::vector<int> v2(10, 0); 			放开后报错	
	LHY::vector<string> v1(10, "xxx");

	for (size_t i = 0; i < v1.size(); i++)
	{
		cout << v1[i] << " ";
	}
	cout << endl;
}

放开注释的那段代码后程序报错,提示非法的间接寻址,这是为什么?

这是因为编译器在执行LHY::vector<int> v2(10, 0); 这句代码时,匹配到了用迭代器区间初始化的构造函数。我们来具体分析一下,LHY::vector<int> v2(10, 0); 如果要进行实例化,走vector(InputIterator first, InputIterator last),那它就会实例化出一个vector(int firse, int last)函数;如果走vector(size_t n, const T& val = T()),就会实例化出一个vector(size_t n, const int& val = int())函数,还要进行整形提升。显然,这句代码和用迭代器区间初始化的构造函数更匹配。

那为什么LHY::vector<string> v1(10, "xxx");可以编过呢?因为10和xxx这两个实参的类型就不一样,只能走vector(size_t n, const T& val = T())

为了解决这个问题,我们只能写一个比vector(InputIterator first, InputIterator last)更适合LHY::vector<int> v2(10, 0); 的构造函数,这个构造函数如下:

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...

		vector(int n, const T& val = T())
		{
			reserve(n);
			for (int i = 0; i < n; i++)
			{
				push_back(val);
			}
		}
		
		// ...

	private:
		iterator _start = nullptr;
		iterator _finish = nullptr;
		iterator _endofstorage = nullptr;
	};
}

这个构造函数的两个形参对于LHY::vector<int> v2(10, 0); 来说,Tint,那么vector(int n, const T& val = T())的两个形参就直接是int类型,跟LHY::vector<int> v2(10, 0); 完美匹配。


3.vector模拟实现完整代码


#pragma once

#include<assert.h>
#include<iostream>

using namespace std;

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		// 迭代器
		iterator begin() { return _start; }
		iterator end() { return _finish; }
		const_iterator begin() const { return _start; }
		const_iterator end() const { return _finish; }

		// capacity和size
		size_t capacity() const { return _endofstorage - _start; }
		size_t size() const { return _finish - _start; }

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		template <class InputIterator>
		vector(InputIterator first, InputIterator last)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		vector(size_t n, const T& val = T())
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		vector(int n, const T& val = T())
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (int i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		vector(const vector<T>& v)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(v.capacity());
			for (auto& e : v)
				push_back(e);
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		vector<T>& operator=(vector<T> tmp)
		{
			swap(tmp);
			return *this;
		}

		~vector()
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					// memcpy(tmp, _start, sizeof(T) * sz);		不能用
					for (int i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		void resize(size_t n, const T& val = T())
		{
			if (n <= size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

		void push_back(const T& x)
		{
			//if (_finish == _endofstorage)
			//{
			//	//size_t sz = size();		// size提前记录
			//	//size_t cp = capacity() == 0 ? 4 : capacity() * 2;
			//	//T* tmp = new T[cp];
			//	//if (_start)				// 判断顺序表是否为空,不为空要进行拷贝
			//	//{
			//	//	memcpy(tmp, _start, sizeof(T) * sz);
			//	//	delete[] _start;
			//	//}

			//	//_start = tmp;
			//	//_finish = _start + sz;
			//	//_endofstorage = _start + cp;
			//	reserve(capacity() == 0 ? 4 : capacity() * 2);
			//}

			//*_finish = x;
			//++_finish;

			insert(end(), x);
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}


		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
			return pos;
		}

		/*void erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
		}*/

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
			return pos;
		}

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

4.练习题


题目链接:https://leetcode.cn/problems/letter-combinations-of-a-phone-number/

class Solution
{
    const char* numStrArr[10] = {"", "", "abc", "def", "ghi", "jkl", "mno", "pqrs", "tuv", "wxyz"};
public:
    void Combine(const string& digits, int i, string combineStr, vector<string>& ret)
    {
        if (i == digits.size())
        {
            ret.push_back(combineStr);
            return;
        }

        int num = digits[i] - '0';
        string str = numStrArr[num];        // 取到数字对应的字符串
        for (auto ch : str)
        {
            Combine(digits, i + 1, combineStr + ch, ret);
        }
    }

    vector<string> letterCombinations(const string& digits) 
    {
        vector<string> v;               // 返回的字符串数组
        if (digits.empty())
            return v;                   // 当digits为空时返回数组

        string combineStr;              // 完成组合的字符串
        Combine(digits, 0, combineStr, v);
        return v;
    }
};

文章来源:https://blog.csdn.net/weixin_73870552/article/details/134463508
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。