C++ 模拟实现string

发布时间:2023年12月21日

目录

一.类的声明

二.确定成员变量

三.成员函数

1.带参的构造函数,析构函数,拷贝构造

2.size()与capacity()

3.运算符重载

重载数组下标访问[]

重载+=??

重载比较运算符(<, <= ,? ?> , >=?,?==? ,?!=? , )

重载流插入与流提取

重载=

?编辑

4.实现迭代器

使用迭代器遍历

使用范围for遍历

5.实现reserve(size_t n)

6.实现push_back(char ch)

7.实现append(const char* str)

8.实现insert()

9.实现erase()

10.实现clear()

11.实现resize()

12实现find()

13.实现substr


一.类的声明

为了避免与库函数里的string类重复定义,这里我们用命名空间,将我们自己定义的string类封到命名空间里,代码为:

namespace wzy
{
    class string
    {
    public:
    //成员变量
    
    private:
    //成员函数

    };
}

二.确定成员变量

我们知道库里面的string类底层大致是使用的是一个字符指针,指向一个数组,然后将对数组的各种操作封装到类中,然后是两个size_t类型的变量记录字符的空间,与有效字符的个数。这里我们的成员变量可以参考:

// 成员变量

char*  _str      //指向存储字符的数组(数组空间大小包含'\0')
size_t _size     //记录数组中有效字符的个数(不包含'\0')
size_t _capacity //记录数组空间的大小(不包含'\0')

三.成员函数

1.带参的构造函数,析构函数,拷贝构造

		string(const char* str="")
			:_str(new char[strlen(str)+1])
			,_size(strlen(str))
			,_capacity(_size+1)
		{}

注:在使用初始化列表的时候,要注意类中成员变量的顺序!!!

原因:初始化列表是按照变量声明的顺序初始化的,建议初始化列表的顺序与成员变量声明的顺序一致.

C++规定常量字符串结尾自动加上'\0',因此这里缺省值相当于"\0"

析构函数:

		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = _capacity=0;
		}

拷贝构造

		string(const string& s)
		{
			_str = new char[s._size + 1];
			strcpy(_str, s._str);
			_size = s._size;
			_capacity = s._capacity;
		}

2.size()与capacity()

		size_t size()   const
		{
			return _size;
		}

		size_t capacity()  const
		{
			return _capacity;
		}

3.运算符重载

重载数组下标访问[]

可读可写

		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[i];
		}

可读不可写(给被const修饰的string对象使用)

		const char& operator[](size_t pos)  const
		{
			assert(pos < _size);
			return _str[i];
		}

使用数组下标的方式遍历string对象

void test1()
{
    string s("Hello World!");
    for(size_t i=0;i<s.size();i++)
    {
        cout<<s[i]<<"  ";
    }
}

重载+=??

		string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}

        
       	string& operator+=(char* str)
		{
			append(str);
			return *this;
		} 

重载比较运算符(<, <= ,? ?> , >=?,?==? ,?!=? , )

		bool operator<(const string& s) const
		{
			return strcmp(_str, s._str)<0;
		}

		bool operator==(const string& s) const
		{
			return strcmp(_str, s._str) == 0;
		}

		bool operator!=(const string& s) const
		{
			return !(*this == s);
		}

		bool operator>(const string& s) const
		{
			return !((*this) < s || (*this) == s);
		}

		bool operator>=(const string& s) const
		{
			return !(*this < s);
		}

		bool operator<=(const string& s) const
		{
			return !(*this > s);
		}

重载流插入与流提取

	ostream& operator<<(ostream& out, const string& s)  
	{
		for (auto ch : s)  //要先实现const迭代器
		{
			out << ch;
		}
		return out;
	}


    istream& operator>>(istream& in, string& s)
	{
        s.clear(); //用之前先清空s
		char ch;
		ch=in.get();  
      //为什么不用in>>ch?
      //流提插入时,不能遇到空格或换行就停止

		while (ch != ' ' && ch != '\n')
		{
			s += ch;
			ch=in.get();
		}
		return in;
	}

这里我们可以发现,在流提取时,当s满时,再插入,每插入一次就要扩容一次。这样效率不好。可以改为:

 istream& operator>>(istream& in, string& s)
	{
        s.clear(); 		
        char ch;
        char buff[128];
		ch=in.get();  
        size_t i=0;

		while (ch != ' ' && ch != '\n')
		{
			buff[i++]=ch;
            if(i==129)
            {
                buff[i]='\0';
                s+=buff;
                i=0;
            }
			ch=in.get();
		}
        if(i)
        {
             s+=buff;
        }
		return in;
	}

这里我们用buff暂存字符,当buff满时,就尾插。结束当buff还有字符时,再尾插。这样可以减少开辟空间的次数。

重载=

		string& operator=(const string& s)
		{
			if (this != &s)
			{
				char* temp = new char[s._capacity + 1];
				strcmp(temp, s._str);
				delete[]_str;
				_str = temp;
				_size = s._size;
				_capacity = s._capacity;
			}
		}

这里我们可以看到里面的交换数据次过多,那我们能不能将其封装到一个函数里呢?

这里首先要介绍一个库函数std::swap(),功能:交换两个变量的值。(变量只能是内置类型!!!)

		void swap(string& s)
		{
			std::swap(_str, s._str);
			std::swap(_size, s._size);
			std::swap(_capacity, s._capacity);
		}

		string& operator=(string temp)
		{
			swap(temp);
            return *this;
		}

这里参数temp不能用引用,被const修饰。

4.实现迭代器

这里我们一定要知道:迭代器很多行为与指针类似。当很多情况下,我们完全可以把迭代器当创指针使用。。因为迭代器也代表指向某个元素;迭代器指向下一个元素与指针的方式一样;迭代器也可以解引用使用元素。

这里我们实现迭代器的方式:使用typedef 将char* 重命名为iterator。因此在这里我们完全可以将迭代器当作指针使用。

正向迭代器

		typedef char* iterator;
		iterator begin()
		{
			return _str;
		}
		iterator end()
		{
			return _str + _size;
		}

const迭代器

		typedef const char* const_iterator;
		const_iterator begin()  const
		{
			return _str;
		}
		const_iterator end() const
		{
			return _str + _size;
		}

使用迭代器遍历

void test2()
{
	string s("Hello World!");
	string::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << "  ";
	}
	cout << endl;
}

使用范围for遍历

我们知道范围for的底层就是使用迭代器实现的,因此当我们实现迭代器之后就可以使用范围for了。

void test3()
{
	string s("Hello World!");
	for(auto ch:s)
    {
        cout<<ch<<" ";
    }
	cout << endl;
}

5.实现reserve(size_t n)

按照库的方式分为两种情况:

1.? n>_capacity 。 扩容(申请新空间,拷贝旧空间,释放旧空间,_str指向新空间,更新_size与_capacity的值)

2. n<=_capacity? 。不做处理

注:这里_str指向新空间我们可以使用:std::swap 作用:交换两个内置类型的值.

只改变 _capacity,不改变 _size

	void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* temp = new char[n+1]; //需要为'\0'开辟空间
				strcpy(temp, _str);
				std::swap(temp, _str);
				delete[]temp;
				_capacity = n;
			}
		}

6.实现push_back(char ch)

这里我们实现push_back按照库里面的方式。

这里我们可以分两种情况:

1._size<_capacity。扩容(使用reserve),然后尾插

2._size==_capacity。直接尾插

void push_back(char ch)
		{
			if (_size == _capacity)
			{
				reserve(_capacity==0?4:_capacity*2);//注意当_capacity==0时
			}
			_str[_size] = ch;
			_size++;
			_str[_size] = '\0';
		}

7.实现append(const char* str)

分两种情况:

1. _szie+strlen(str)>_capacity 。扩容(使用reserve),然后再将str的内容拷贝到_str里

2._szie+sizeof(str)<=_capacity。 直接拷贝

		void append(const char* str)
		{
			size_t len = strlen(str);

			if (_size + len >= _capacity)    //第一种情况
			{
				reserve(_size + len);//这里的扩容具体还得看要求
			}

			strncpy(_str+_size,str,len);//strncpy可以把'\0'也拷贝过来
			_size += len;
		}

8.实现insert()

string底层用的是数组,这里在将一个字符或字符串插入某个位置,可以看作像数组里插入。

		string& insert(size_t pos, char ch)
		{
			assert(pos <= _size);  //检查插入位置是否正确
			if (_size == _capacity)//检测是否扩容
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}


            //这里要注意size_t是无符号的整形,要注意头插时,i的初始化值
            //这里即使i为整形,i也会被整形提升为size_t类型
			for (size_t i = _size+1; i > pos; i--) 
			{
				_str[i] = _str[i - 1];
			}
			_str[pos] = ch;
			_size++;
		}


		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _capacity);
			int len = strlen(str);
			if (pos + len > _capacity)   //检查是否扩容
			{
				reserve(pos + len);
			}

			for (int i = _size; i >=(int)pos; i--)
			{
				_str[i+len] = _str[i];
			}

			strncpy(_str + pos, str, len);
			_size += len;
			return *this;
		}

9.实现erase()

void erase(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos+len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				size_t begin = pos + len;
				while (begin <= _size)
				{
					_str[begin - len] = _str[begin];
					begin++;
				}
				_size -= len;
			}
		}

这里npos时一个无符号的整形,是size_t类型最大的整数,比特为全为1,所以直接赋值为1.

因为npos属于string类的成员变量,它的值不变,因此我们可以用const与static修饰它。我们知道被static修饰的变量要在类外面定义,但是C++11中,const修饰的static的成员变量(只能是整形),可以直接在类里面给缺省值

10.实现clear()


		void clear()
		{
			_str[0] = '\0';
			_size = 0;
		}

11.实现resize()

以库里面的resize为例,分三种情况:
1.? n>_capacity? ,扩容,初始化多出来的空间。

2.? _size<n<_capcity? ,将大于_size,小于n的空间初始化。

3. n<_size , 缩容

		void resize(size_t n, char ch = '\0')
		{
			if (n <= _capacity)
			{
				_str[n] = '\0';
				_size = n;
			}
			else
			{
				reserve(n);
				int i;
				for (i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_str[i] = '\0';
			}
		}

12实现find()

在字符串中查找子串在理论上效率很高,但是在实际上效率并不好,所以我们一般用可以直接暴力查找。这里我们直接用了一个strstr()函数查找。

找到就返回子串的首地址,没找到就返回空指针。

        size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);
			for (size_t i = pos; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}


		size_t find(const char* sub, size_t pos = 0)
		{
			const char* p = strstr(_str, sub);
			if (p)
			{
				return p-_str;
			}
			return npos;
		}

13.实现substr

分两种情况:

1. pos+len>=_size,

2.pos+len <_size

		string substr(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			string s;
			size_t end = len + pos;
			if (len==npos||pos + len >= _size )
			{
				len = _size - pos;
				end = _size;
			}
			s.reserve(len);
			for (size_t i = pos; i < end; i++)
			{
				s += _str[i];
			}
			return s;
		}

注:使用这个函数时,要先实现拷贝构造,否则在传返回值的时候是浅拷贝,会报错。

完整代码:

因为string类的方法太多,这里我只选了几个我们经常使用的实现,大家可以参考我这个头文件,继续实现下去:

#pragma once
#include<iostream>

#include<assert.h>
using namespace std;




namespace wzy
{
	class string
	{
	public:

		string(const char* str = "")
			:_str(new char[strlen(str) + 1])
			, _size(strlen(str))
			, _capacity(_size + 1)
		{}

		string(const string& s)
		{
			_str = new char[s._size + 1];
			strcpy(_str, s._str);
			_size = s._size;
			_capacity = s._capacity;
		}

		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = _capacity = 0;
		}

		size_t size()
		{
			return _size;
		}

		size_t capacity()
		{
			return _capacity;
		}

		char& operator[](int i)
		{
			assert(i < _size);
			return _str[i];
		}

		typedef char* iterator;
		typedef const char* const_iterator;

		iterator begin()
		{
			return _str;
		}
		iterator end()
		{
			return _str + _size;
		}

		const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

		void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* temp = new char[n + 1];
				strcpy(temp, _str);
				std::swap(temp, _str);
				delete[]temp;
				_capacity = n;
			}
		}

		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				reserve(_capacity * 2);
			}
			_str[_size] = ch;
			_size++;
			_str[_size] = '\0';
		}

		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len >= _capacity)
			{
				reserve(_size + len);//这里的扩容具体还得看要求
			}
			strncpy(_str + _size, str, len);//strncpy可以把'\0'也拷贝过来
			_size += len;
		}

		string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}

		string& operator+=(char* str)
		{
			append(str);
			return *this;
		}

		void insert(size_t pos, char ch)
		{
			assert(pos <= _size);  //检查插入位置是否正确
			if (_size == _capacity)//检测是否扩容
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}

			for (size_t i = _size + 1; i > pos; i--)
			{
				_str[i] = _str[i - 1];
			}
			_str[pos] = ch;
			_size++;
		}

		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _capacity);
			int len = strlen(str);
			if (pos + len > _capacity)
			{
				reserve(pos + len);
			}

			for (int i = _size; i >= (int)pos; i--)
			{
				_str[i + len] = _str[i];
			}

			strncpy(_str + pos, str, len);
			_size += len;
			return *this;
		}

		bool operator<(const string& s) const
		{
			return strcmp(_str, s._str) < 0;
		}

		bool operator==(const string& s) const
		{
			return strcmp(_str, s._str) == 0;
		}

		bool operator!=(const string& s) const
		{
			return !(*this == s);
		}

		bool operator>(const string& s) const
		{
			return !((*this) < s && (*this) == s);
		}

		bool operator>=(const string& s) const
		{
			return !(*this < s);
		}

		bool operator<=(const string& s) const
		{
			return !(*this > s);
		}

		string& operator=(const string& s)
		{
			if (this != &s)
			{
				char* temp = new char[s._capacity + 1];
				strcmp(temp, s._str);
				delete[]_str;
				_str = temp;
				_size = s._size;
				_capacity = s._capacity;
			}
		}

		void swap(string& s)
		{
			std::swap(_str, s._str);
			std::swap(_size, s._size);
			std::swap(_capacity, s._capacity);
		}

		string& operator=(string s)
		{
			if (this != &s)
			{
				swap(s);
				return *this;
			}
		}

		void clear()
		{
			_str[0] = '\0';
			_size = 0;
		}

		void erase(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
			}
			else
			{
				size_t begin = pos + len;
				while (begin <= _size)
				{
					_str[begin - len] = _str[begin];
					begin++;
				}
				_size -= len;
			}
		}

		void resize(size_t n, char ch = '\0')
		{
			if (n <= _capacity)
			{
				_str[n] = '\0';
				_size = n;
			}
			else
			{
				reserve(n);
				int i;
				for (i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_str[i] = '\0';
			}
		}

		size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);
			for (size_t i = pos; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}

		size_t find(const char* sub, size_t pos = 0)
		{
			const char* p = strstr(_str, sub);
			if (p)
			{
				return p-_str;
			}
			return npos;
		}

		string substr(size_t pos, size_t len = npos)
		{
			assert(pos < _size);
			string s;
			size_t end = len + pos;
			if (len==npos||pos + len >= _size )
			{
				len = _size - pos;
				end = _size;
			}
			s.reserve(len);
			for (size_t i = pos; i < end; i++)
			{
				s += _str[i];
			}
			return s;
		}

	private:
		char* _str;
		size_t _size;
		size_t _capacity;
		public:
		const static size_t npos;
	};

	const size_t string::npos = -1;

	ostream& operator<<(ostream& out, const string& s)
	{
		for (auto ch : s)
		{
			out << ch;
		}
		return out;
	}



	istream& operator>>(istream& in, string& s)
	{
		s.clear();
		char ch;
		ch=in.get() ;
		while (ch != ' ' && ch != '\n')
		{
			s += ch;
			ch=in.get();
		}
		return in;
	}
}

文章来源:https://blog.csdn.net/qq_63440853/article/details/135106543
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。