C语言中,字符串是以
'\0'
结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str
系列的库函数,但是这些库函数与字符串是分离开的,不太符合面向对象编程的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。所以C++引入了string
类作为标准库中用于处理字符串的数据类型。string
类封装了字符串的操作,提供了更方便、安全和高级的字符串处理功能,更符合面向对象编程的思想。
英文解释:
简单来说:
- string是表示字符串的字符串类
- 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- string在底层实际是:basic_string模板类的别名,
typedef basic_string<char, char_traits, allocator>string;
- 不能操作多字节或者变长字符的序列。
(constructor)函数代码 | 功能说明 |
---|---|
string(); | (默认构造函数)构造一个空字符串,长度为零个字符。 |
string(const string& str); | (拷贝构造函数)构造一个 str 的副本。 |
string (const string& str, size_t pos, size_t len = npos); | (子串构造函数)拷贝 str 从字符位置 pos 开始,跨越 len 个字符(如果 str 太短或者 len 为string::npos ,则复制直到 str 的末尾)。 |
string(const char* s); | 拷贝由 s 指向的以空字符结尾的字符序列(C 字符串)。 |
string (const char* s, size_t n); | 从由 s 指向的字符数组中拷贝前 n 个字符。 |
string(size_t n, char c); | 使用字符 c 连续填充字符串 n 次。 |
template <class InputIterator> string (InputIterator first, InputIterator last); | 拷贝迭代器区间[first, last) 范围内的字符序列。 |
实例:
// string constructor
#include <iostream>
#include <string>
int main()
{
std::string s0("Initial string");
// 按照上述描述的顺序使用的构造函数
std::string s1;
std::string s2(s0);
std::string s3(s0, 8, 3);
std::string s4("A character sequence");
std::string s5("Another character sequence", 12);
std::string s6a(10, 'x');
std::string s6b(10, 42); // 42 is the ASCII code for '*'
std::string s7(s0.begin(), s0.begin() + 7);
std::cout << "s1: " << s1 << "\ns2: " << s2 << "\ns3: " << s3;
std::cout << "\ns4: " << s4 << "\ns5: " << s5 << "\ns6a: " << s6a;
std::cout << "\ns6b: " << s6b << "\ns7: " << s7 << '\n';
return 0;
}
输出结果:
函数名称 | 代码 | 功能说明 |
---|---|---|
size | size_t size() const; | 返回字符串有效字符长度。 |
length | size_t length() const; | 返回字符串有效字符长度。 |
max_size | size_t max_size() const; | 返回字符串可以达到的最大长度。 |
resize | void resize (size_t n); void resize (size_t n, char c); | 将字符串调整为长度为 n 的字符。如果 n 小于当前字符串的长度,当前值将缩短为其前 n 个字符,删除第 n 个字符之后的字符。如果 n 大于当前字符串的长度,当前内容将被扩展,插入足够数量的字符以达到大小为 n。如果指定了字符 c,则新元素将被初始化为 c 的副本,否则它们将是值初始化的字符(空字符)。 |
capacity | size_t capacity() const; | 以字节为单位,返回当前为字符串分配的存储空间的大小。 |
reserve | void reserve (size_t n = 0); | 请求将字符串的容量调整为计划更改的大小,最多达到长度为 n 的字符。如果 n 大于当前字符串的容量,该函数将导致容器增加其容量以容纳 n 个字符(或更多)。在所有其他情况下,它被视为非强制性请求来缩小字符串的容量:容器的实现可以自由优化,并保留容量大于 n 的字符串。该函数不会对字符串长度产生影响,也不能修改其内容。 |
clear | void clear(); | 清空有效字符。 |
empty | bool empty() const; | 返回字符串是否为空(即长度是否为 0)。 |
函数名称 | 代码 | 功能说明 |
---|---|---|
operator[] | char& operator[] (size_t pos); const char& operator[] (size_t pos) const; | 返回字符串中位置 pos 处字符的引用。 |
at | char& at (size_t pos); const char& at (size_t pos) const; | 返回字符串中位置 pos 处字符的引用。该函数会自动检查 pos 是否是字符串中一个有效的字符位置(即,pos 是否小于字符串的长度),如果不是,则抛出 out_of_range 异常。 |
back | char& back(); const char& back() const; | 返回字符串的最后一个字符的引用。该函数不应在空字符串上调用。 |
front | char& front(); const char& front() const; | 返回字符串的第一个字符的引用。 |
遍历操作
#include <iostream>
#include <string>
int main()
{
std::string str("Test string");
// 1.普通下标遍历
for (size_t i = 0; i < str.size(); ++i)
std::cout << str[i];
std::cout << '\n';
// 2.迭代器遍历
for (std::string::iterator it = str.begin(); it != str.end(); ++it)
std::cout << *it;
std::cout << '\n';
// 3.范围for遍历
for (auto e : str)
std::cout << e;
std::cout << '\n';
return 0;
}
解释
- 普通下标遍历:
在这个部分的代码中,使用了一个普通的for
循环和下标操作符[]
来遍历字符串中的字符。循环变量i
从0开始递增,直到达到字符串的长度(通过str.size()
获取)。在每次迭代中,使用str[i]
来获取对应位置的字符,并使用std::cout
打印出来。- 迭代器遍历:
这部分代码使用了迭代器来遍历字符串中的字符。通过调用str.begin()
获取字符串的起始位置迭代器,并使用str.end()
获取字符串的结束位置迭代器。然后,使用一个for
循环和迭代器操作来遍历字符串中的每个字符。在每次迭代中,使用解引用操作符*
来获取当前迭代器指向的字符,并使用std::cout
打印出来。- 范围
for
遍历:
在这部分代码中,使用了范围for
循环来遍历字符串中的字符。通过for (auto e : str)
的语法,将字符串中的每个字符依次赋值给变量e
。在每次迭代中,直接使用变量e
来表示当前字符,并使用std::cout
打印出来。
函数名称 | 代码 | 功能说明 |
---|---|---|
operator+= | string& operator+= (const string& str); string& operator+= (const char* s); string& operator+= (char c); | 在字符串末尾追加字符串 str、C字符串 s 或字符 c。 |
append | string& append (const string& str); | 在字符串后追加一个字符串 str。 |
push_back | void push_back (char c); | 在字符串后尾插字符 c。 |
insert | string& insert (size_t pos, const string& str); | 在指定位置 pos 插入另一个字符串 str。 |
erase | string& erase (size_t pos = 0, size_t len = npos); | 从字符串的位置 pos 开始删除长度为 len 的字符(如果内容太短或者 len 为 string::npos ,则直到字符串的末尾)。如果未提供 len 参数,则默认删除从位置 pos 开始到字符串末尾的所有字符(类似于成员函数 clear)。返回一个引用,指向当前字符串的修改后的对象。 |
函数名称 | 代码 | 功能说明 |
---|---|---|
c_str | const char* c_str() const; | 回一个指向以空字符结尾的字符序列(即 C 字符串)的指针,该字符序列表示当前字符串对象的值。 |
substr | string substr (size_t pos = 0, size_t len = npos) const; | 返回一个新构造的字符串对象,其值为当前对象的子串副本。子串是从字符位置 pos 开始的、长度为 len 的字符序列(或者直到字符串的末尾)。 |
find | size_t find (const string& str, size_t pos = 0) const; size_t find (const char* s, size_t pos = 0) const; | 在当前字符串的 pos 索引位置(默认为0)开始,查找子串 str(或C 字符串 s),返回找到的位置索引,-1表示查找不到子串。 |
rfind | size_t rfind (const string& str, size_t pos = npos) const; size_t rfind (const char* s, size_t pos = npos) const; | 在当前字符串的 pos 索引位置开始,反向查找子串 str(或C 字符串 s),返回找到的位置索引,-1表示查找不到子串。 |
find_first_of | size_t find_first_of (const char* s, size_t pos = 0) const; | 在当前字符串的 pos 索引位置(默认为0)开始,在字符串中搜索与其参数中指定的任意字符匹配的第一个字符。 |
find_last_of | size_t find_last_of (const char* s, size_t pos = npos) const; | 在当前字符串的 pos 索引位置(默认为0)开始,在字符串中搜索与其参数中指定的任意字符匹配的最后一个字符。 |
find_first_not_of | size_t find_first_not_of (const char* s, size_t pos = 0) const; | 在当前字符串的 pos 索引位置开始,在字符串中搜索与其参数中指定的任意字符不匹配的第一个字符。 |
find_last_not_of | size_t find_last_not_of (const char* s, size_t pos = npos) const; | 在当前字符串的 pos 索引位置开始,在字符串中搜索与其参数中指定的任意字符不匹配的最后一个字符。 |
函数名称 | 代码 | 功能说明 |
---|---|---|
operator+ | string operator+ (const string& lhs, const string& rhs); | 返回一个新构造的字符串对象,其值是将 lhs 的字符后跟 rhs 的字符连接而成。 |
operator>> | istream& operator>> (istream& is, string& str); | 支持 cin 读入 string 类对象,遇到空格回车结束。 |
operator<< | ostream& operator<< (ostream& os, const string& str); | 支持 cout 输出 string 类对象。 |
getline | istream& getline (istream& is, string& str); | 从输入流 is 中提取字符,并将它们存储到字符串 str 中,直到找到换行字符 ‘\n’。 |
relational operators | operator== operator!= operator< operator<= operator> operator>= | 支持比较操作符(==,!=,<,<=,>,>=) |
说明
getline(cin, s)
会获取前一个输入的换行符,需要在前面添加读取换行符的语句。如:getchar()
或cin.get()
。例如:
int n; string s; cin >> n; getchar(); //cin.get() getline(cin, s); // 可正确读入下一行的输入
operator+
尽量少用,因为传值返回,导致深拷贝效率低。
// string.h 文件
#pragma once
#include <iostream>
#include <string.h>
#include <assert.h>
using namespace std;
namespace bit
{
class string
{
friend ostream& operator<<(ostream& _cout, const bit::string& s);
friend istream& operator>>(istream& _cin, bit::string& s);
public:
typedef char* iterator;
typedef const char* const_iterator;
public:
string(const char* str = "")
:_size(strlen(str))
, _capacity(_size)
{
_str = new char[_capacity + 1];
strcpy(_str, str);
}
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
string(const string& s)
:_size(0)
, _capacity(0)
, _str(nullptr)
{
string tmp(s._str);
swap(tmp);
}
string& operator=(const string& s)
{
if (this != &s)
{
string tmp(s);
swap(tmp);
}
return *this;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
size_t size()const
{
return _size;
}
size_t capacity()const
{
return _capacity;
}
bool empty()const
{
return _size;
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void resize(size_t n, char c)
{
if (n <= _size)
{
_str[n] = '\0';
_size = n;
}
else
{
reserve(n);
while (_size < n)
{
_str[_size] = c;
++_size;
}
_str[_size] = '\0';
}
}
void push_back(char c)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size++] = c;
_str[_size] = '\0';
}
string& operator+=(char c)
{
push_back(c);
return *this;
}
void append(const char* str)
{
size_t len = strlen(str);
if (len + _size > _capacity)
{
reserve(len + _size);
}
strcpy(_str + _size, str);
_size += len;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
string substr(size_t pos, size_t len)
{
string s;
size_t end = pos + len - 1;
if (len == npos || pos + len >= _size)
{
len = _size - pos;
end = _size;
}
s.reserve(len);
for (size_t i = pos; i <= end; i++)
{
s += _str[i];
}
return s;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
const char* c_str()const
{
return _str;
}
char& operator[](size_t index)
{
assert(index < _size);
return _str[index];
}
const char& operator[](size_t index)const
{
assert(index < _size);
return _str[index];
}
bool operator<(const string& s)
{
return strcmp(_str, s._str) < 0;
}
bool operator==(const string& s)
{
return strcmp(_str, s._str) == 0;
}
bool operator<=(const string& s)
{
return *this < s || *this == s;
}
bool operator>(const string& s)
{
return !(*this <= s);
}
bool operator>=(const string& s)
{
return !(*this < s);
}
bool operator!=(const string& s)
{
return !(*this == s);
}
size_t find(char c, size_t pos) const
{
while (pos < _size)
{
if (_str[pos] == c)
{
return pos;
}
pos++;
}
return npos;
}
size_t find(const char* s, size_t pos) const
{
const char* p = strstr(_str + pos, s);
if (p)
return p - _str;
else
return npos;
}
bit::string& insert(size_t pos, char c)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
size_t end = _size + 1;
while (end >= pos + 1)
{
_str[end] = _str[end - 1];
--end;
}
_str[pos] = c;
_size++;
return *this;
}
bit::string& insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (len == 0)
return *this;
if (len + _size > _capacity)
{
reserve(len + _size);
}
size_t end = _size + len;
while (end >= pos + len)
{
_str[end] = _str[end - len];
--end;
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
bit::string& erase(size_t pos, size_t len)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
size_t begin = pos + len;
while (begin <= _size)
{
_str[begin - len] = _str[begin];
++begin;
}
_size -= len;
}
return *this;
}
private:
char* _str;
size_t _size;
size_t _capacity;
public:
const static size_t npos;
};
ostream& operator<<(ostream& _cout, const bit::string& s)
{
for (auto e : s)
_cout << e;
return _cout;
}
istream& operator>>(istream& _cin, bit::string& s)
{
s.clear();
char buff[129];
size_t i = 0;
char ch;
ch = _cin.get();
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 128)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = _cin.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return _cin;
}
};
const size_t bit::string::npos = -1;