简介:
????????string 是 C++ 中常用的一个类,它非常重要,我们有必要在此单独讲解一下。
使用 string 类需要包含头文件<string>,下面的例子介绍了几种定义 string 变量(对象)的方法:
?
#include<iostream>
#include<string>
using namespace std;
int main(){
string s1;
string s2 ="c plus plus";
string s3 =s2;
string s4(5,'s');
return0;
}
?
变量 s1 只是定义但没有初始化,编译器会将默认值赋给 s1,默认值是"",也即空字符串。
变量 s2 在定义的同时被初始化为"c plus plus"。与C风格的字符串不同,string 的结尾没有结束标志'\0'。
变量 s3 在定义的时候直接用 s2 进行初始化,因此 s3 的内容也是"c plus plus"。
变量 s4 被初始化为由 5 个's'字符组成的字符串,也就是"sssss"。
从上面的代码可以看出,string 变量可以直接通过赋值操作符=进行赋值。string 变量也可以用C风格的字符串进行赋值,例如,
s2 是用一个字符串常量进行初始化的,而 s3 则是通过 s2 变量进行初始化的。
与C风格的字符串不同,当我们需要知道字符串长度时,可以调用 string 类提供的 length() 函数。如下所示:
string s ="http://c.biancheng.net";
intlen =s.length();
cout<<len<<endl;
输出结果为22。由于 string 的末尾没有'\0'字符,所以 length() 返回的是字符串的真实长度,而不是长度 +1。
转换为C风格的字符串
虽然 C++ 提供了 string 类来替代C语言中的字符串,但是在实际编程中,有时候必须要使用C风格的字符串(例如打开文件时的路径),
为此,string 类为我们提供了一个转换函数 c_str(),该函数能够将 string 字符串转换为C风格的字符串,并返回该字符串的 const 指针(const char*)。
请看下面的代码:
string path ="D:\\demo.txt";
FILE *fp =fopen(path.c_str(),"rt");
为了使用C语言中的 fopen() 函数打开文件,必须将 string 字符串转换为C风格的字符串。
string 字符串的输入输出
string 类重载了输入输出运算符,可以像对待普通变量那样对待 string 变量,也就是用>>进行输入,用<<进行输出。请看下面的代码:
#include<iostream>
#include<string>
using namespace std;
int main()
{
string s;
cin>>s;//输入字符串
cout<<s<<endl;//输出字符串
return0;
}
运行结果:
abc
def
虽然我们输入了两个由空格隔开的网址,但是只输出了一个,这是因为输入运算符>>默认会忽略空格,遇到空格就认为输入结束,
所以最后输入的http://vip.biancheng.net没有被存储到变量 s。
访问字符串中的字符
string 字符串也可以像C风格的字符串一样按照下标来访问其中的每一个字符。string 字符串的起始下标仍是从 0 开始。请看下面的代码:
????????
#include<iostream>
#include<string>
usingnamespacestd;
int main()
{
string s ="1234567890";
for(inti=0,len=s.length();i<len;i++)
{
cout<<s[i]<<" ";
}
cout<<endl;
s[5]='5';
cout<<s<<endl;
return0;
}
运行结果:
1 2 3 4 5 6 7 8 9 0
1234557890
本例定义了一个 string 变量 s,并赋值 "1234567890",之后用?for 循环遍历输出每一个字符。借助下标,除了能够访问每个字符,
也可以修改每个字符,s[5] = '5';就将第6个字符修改为 '5',所以 s 最后为 "1234557890"。
字符串的拼接
有了 string 类,我们可以使用+或+=运算符来直接拼接字符串,非常方便,再也不需要使用C语言中的 strcat()、strcpy()、malloc() 等函数来拼接字符串了,
再也不用担心空间不够会溢出了。
用+来拼接字符串时,运算符的两边可以都是 string 字符串,也可以是一个 string 字符串和一个C风格的字符串,还可以是一个 string 字符串和一个字
数组,或者是一个 string 字符串和一个单独的字符。请看下面的例子:
#include<iostream>
#include<string>
using namespace std;
int main()
{
string s1 ="first ";
string s2 ="second ";
char*s3 ="third ";
chars4[]="fourth ";
charch ='@';
string s5 =s1 +s2;
string s6 =s1 +s3;
string s7 =s1 +s4;
string s8 =s1 +ch;
cout<<s5<<endl<<s6<<endl<<s7<<endl<<s8<<endl;
return0;
}
运行结果:
first second
first third
first fourth
first @
string 字符串的增删改查
C++ 提供的 string 类包含了若干实用的成员函数,大大方便了字符串的增加、删除、更改、查询等操作。
1. 插入字符串
insert() 函数可以在 string 字符串中指定的位置插入另一个字符串,它的一种原型为:
string& insert (size_t pos, const string& str);
pos 表示要插入的位置,也就是下标;str 表示要插入的字符串,它可以是 string 字符串,也可以是C风格的字符串。
请看下面的代码:
#include<iostream>
#include<string>
using namespace std;
intmain()
{
string s1,s2,s3;
s1 =s2 ="1234567890";
s3 ="aaa";
s1.insert(5,s3);
cout<<s1 <<endl;
s2.insert(5,"bbb");
cout<<s2 <<endl;
return0;
}
运行结果:
12345aaa67890
12345bbb67890
insert() 函数的第一个参数有越界的可能,如果越界,则会产生运行时异常,我们将会在《C++异常(Exception)》一章中详细讲解如何捕获这个异常。
更多 insert() 函数的原型和用法请参考: string::insert - C++ Reference
2. 删除字符串
erase() 函数可以删除 string 中的一个子字符串。它的一种原型为:
string& erase (size_t pos = 0, size_t len = npos);
pos 表示要删除的子字符串的起始下标,len 表示要删除子字符串的长度。如果不指明 len 的话,那么直接删除从 pos 到字符串结束处的所有字符(此时 len = str.length - pos)。
请看下面的代码:
#include<iostream>
#include<string>
using namespace std;
int main()
{
string s1,s2,s3;
s1 =s2 =s3 ="1234567890";
s2.erase(5);
s3.erase(5,3);
cout<<s1 <<endl;
cout<<s2 <<endl;
cout<<s3 <<endl;
return0;
}
运行结果:
1234567890
12345
1234590
有读者担心,在 pos 参数没有越界的情况下, len 参数也可能会导致要删除的子字符串越界。但实际上这种情况不会发生,erase() 函数会从以下两
个值中取出最小的一个作为待删除子字符串的长度:
说得简单一些,待删除字符串最多只能删除到字符串结尾。
3. 提取子字符串
substr() 函数用于从 string 字符串中提取子字符串,它的原型为:
string substr (size_t pos = 0, size_t len = npos) const;
pos 为要提取的子字符串的起始下标,len 为要提取的子字符串的长度。
请看下面的代码:
#include<iostream>
#include<string>
using namespace std;
int main()
{
string s1 ="first second third";
string s2;
s2 =s1.substr(6,6);
cout<<s1 <<endl;
cout<<s2 <<endl;
return0;
}
运行结果:
first second third
second
系统对 substr() 参数的处理和 erase() 类似:
- 如果 pos 越界,会抛出异常;
- 如果 len 越界,会提取从 pos 到字符串结尾处的所有字符。
4.?字符串查找
string 类提供了几个与字符串查找有关的函数,如下所示。
1) find() 函数
find() 函数用于在 string 字符串中查找子字符串出现的位置,它其中的两种原型为:
size_t find (const string& str, size_t pos = 0) const;
size_t find (const char* s, size_t pos = 0) const;
第一个参数为待查找的子字符串,它可以是 string 字符串,也可以是C风格的字符串。第二个参数为开始查找的位置(下标);如果不指明,
则从第0个字符开始查找。
请看下面的代码:
#include<iostream>
#include<string>
using namespace std;
int main()
{
string s1 ="first second third";
string s2 ="second";
intindex =s1.find(s2,5);
if(index <s1.length())
cout<<"Found at index : "<<index <<endl;
else
cout<<"Not found"<<endl;
return0;
}
运行结果:
Found at index : 6
find() 函数最终返回的是子字符串第一次出现在字符串中的起始下标。本例最终是在下标6处找到了 s2 字符串。如果没有查找到子字符串,那么会
返回一个无穷大值 4294967295。
String 、 char比较
? | string | char*、char[] |
头文件 | #include <string> | 不需要 |
定义与初始化 | string s1(“abc”); string s2(s1); string s3(4, ‘s’);//初始化为4个’s’ | char* a = “test”;//数据存在静态存储区,不能修改 char a[] = “test”;//开辟数组再存储,可以修改 char* a = new char[10]; memset(a, ‘0’, sizeof(char)*10); |
相互转化 | char* p = “hello”; string s(p); s = p; | string str(“test”); const char* p = str.data();//记得要加const或者强制类型转换成(char*) const char* p = str.c_str(); char p[10]; std::size_t length =?str.copy(p,5,0);//从第0个开始复制5个,返回有效复制的数量,需要在p最后添加’\0’ char * cstr = new char [str.length()+1]; std::strcpy (cstr, str.c_str()); 或者逐个复制 |
实际大小 | str.size() | std::strlen(p)//#include <cstring>(C++写法)或者<string.h>(C写法) |
容器大小 | str.capacity() | 数组形式p[],可以使用sizeof(p)来获得数组大小 指针形式没有容器概念,除非是new的,对指针用sizeof将得到指针本身的大小,由系统位数决定 |
倒置 | #include <algorithm> // std::reverse std::reverse(str.begin(),str.end()); | char* strrev(char* s); |
查找字符&字符串 | find//从头开始找 rfind//从尾开始找 这四个函数都有四种重载: size_t find (const string& str, size_t pos = 0);//查找子string,默认从父string的第0个字符开始,如果要查找多个相似的,则可以将pos设置为上次查找到的+1 size_t find (const char* s, size_t pos = 0);//查找字符串,默认从0开始 size_t find (const char* s, size_t pos, size_type n);//同上,但只比较n个 size_t find (char c, size_t pos = 0);//比较字符。 当然,形参初始化的值可能不一样,返回的都是地址索引,需要通过found!=std::string::npos判断是否有效。 | char* strchr(char* s, char c);//查找字符串s中首次出现字符c的位置,返回c位置的指针,如不存在返回NULL char * strrchr(const char?str, int c);//查找字符倒数第一次出现的位置 char *strstr(const char *s1,const char *s2);//查找第一次出现s2的位置,返回s2的位置指针,如不存在返回NULL char *strrstr(const char *s1,const char *s2);//查找倒数第一个出现s2的位置 int?strspn(const?char?s,const?char?accept);//作用同右侧find_first_not_of。返回s中第一个没有在accept出现的字符的索引。通过两个for循环来实现 int?strcspn(const?char?s,const?char?*reject);//返回s中第一个在reject出现的字符的索引 |
大小写转换 | 两者都是不提供这个功能的,但是C++有两个库函数,头文件是#include <ctype.h>: int tolower ( int c ); int toupper ( int c ); | 实现也很简单: int tolower(int c) { if ((c >= ‘A’) && (c <= ‘Z’)) return c + (‘a’ - ‘A’); return c; } |
比较字符串大小 | 一共五种重载形式 int compare (const string& str); int compare (size_t pos, size_t len, const string& str); int compare (size_t pos, size_t len, const string& str, size_t subpos, size_t sublen); int compare (const char* s) const; int compare (size_t pos, size_t len, const char* s); int compare (size_t pos, size_t len, const char* s, size_t n); 返回与右边一致,其中pos表示从str的第几个元素开始比较,一共比较len个字符,如果不够,则有多少比较多少。subpos、sublen是相对比较字符串而言的 string重载了==、<等符号,可以直接用符号比较 string没有提供不区分大小写的比较,感觉可以读取出数据后通过右侧的函数来进行比较。 | int strcmp(char* s1, char* s2);//区分字母大小写比较 当s1 < s2时,返回值<0; //对于第一个不相等的字符,s1对应的小于s2对应的,或者全相等,但是s1的字符数量少于s2的字符数量 当s1 = s2时,返回值=0; 当s1 > s2时,返回值>0。 int stricmp(char* s1, char* s2);//不区分字母大小写 int strncmp(char* s1, char* s2, int n);//只比较前n个字符,区分大小 int strnicmp(char* s1, char* s2, int n);//之比较前n,不区分大小写 |
数字转字符串 | 1、stringstream(多次使用需要使用clear()清除) int N = 10; stringstream ss;//#include <sstream> string str; ss ??N; ss?? str; 2、string = std::to_string(N)方法 只需包含<string>头文件即可 | 1、使用sprintf:#include <stdio.h> char c[100]; int k=255; sprintf(c,”%d”,k);//d是有符号10进制数,u是无符号10进制 double a=123.321; sprintf(c,”%.3lf”,a); sprintf(c,”%x”,k);//转换成16进制,如果想要大写的话可以用X,8进制是o //c包含”ff” c[0]=’f’ c[1]=’f’ 2、itoa貌似跟平台有关,不建议使用。 |
字符串转数字 | 1、N = stringToNum<int>(str);//需要#include <sstream> 2、在<string>中实现的 int stoi (const string& str, size_t* idx = 0, int base = 10);//idx返回第一个非数字的指针索引,base默认10进制 long stol、unsigned long stoul、long long stoll、unsigned long long stoull、float stof、double stod、long double stold 3、stringstream//#include <sstream> string a = “123.32”; double res; stringstream ss; ss ??a; ss?? res; | char a[10] = {“255”}; int b; sscanf(a,”%d”,&b); char a[10] = {“ff”};//十六进制 int b; sscanf(a,”%x”,&b); char str[]=”123.321”;? double a;? sscanf(str,”%lf”,&a); 另外也可以用atoi(),atol(),atof() |
拷贝与合并 | char p[10]; std::size_t length =?str.copy(p,5,0);//从第0个开始复制5个,返回有效复制的数量,需要在p最后添加’\0’ 合并直接用+号即可 或者用.append() string& append (const string& str); string& append (const string& str, size_t subpos, size_t sublen); string& append (const char* s); string& append (const char* s, size_t n); string& append (size_t n, char c); | char* strcpy(char* dest, char* src);//把从src地址开始且含有 ‘\0’结束符的字符串复制到以dest开始的地址空间。返回指向dest的指针。 char* strncpy(char* dest, char* src, int size_tn);//复制n个,这个复制不保证NULL结尾,需要自己初始化。 char* strcat(char* dest, char* src);//把src所指字符串添加到dest结尾处(覆盖dest结尾处的 ‘\0’)并添加 ‘\0’。返回指向dest的指针。且内存不可重叠。 char* strncat(char* dest, char* src, int n);//部分合并 用sprintf也行,但是效率不高。 |
字符串切割 | string substr (size_t pos = 0, size_t len = npos): std::string str2 = str.substr (3,5);//返回str的第3个开始的5个元素。可以配合find函数来实现针对特殊元素的切割 | char* strtok (char* str,constchar* delimiters );//以delimiters中的每个字符作为分割符,将str剪切,返回一个个字符串。传入NULL时代表继续切割后续的。下面的程序预计输出hello boy this is heima。第二个参数可以是” ,\t\n\\“等。(其实就是将被切割的换成’\0’?待分割字符串的完整性会被破坏,而且线程不安全。具体分析请看strtok的安全性探讨) ? |
?