正确区分和认识字符串的各种操作。

留待讨论字符串与流

以及中文编码问题

一、字符类型

一般来说字符就是char

c/c++中为ascii编码,char长度为1字节,取值范围 -128<<127 (最基本的ascii码最高位为0 取值0-127 详见);java中为unicode编码,char长度为2字节,取值范围 0<<65535。

  1. char a = 'r'; //正确
  2. char b = "r"; //错误 把 const char * 字符串字面量(数组)传给 char
  3. char c = '你'; //错误 中文编码问题,C++ char只支持ascii
  4. char d = '\63'; //正确,八进制 63 ==‘3’
  5. char e = 063; // 正确,八进制 63 == ‘3’
  6. char f = 63; // 正确,十进制63 == ‘?’

通过添加前缀可以改变字符常量或者字符串常量的类型,前缀及其含义如下表所示:

1195545753997676544.png

二、字符串类型

字符串就是一系列的字符。

字符串常量

  1. 定义:用双引号`“ ”`括起来的0个或者多个字符组成的序列
  2. 存储:每个字符串尾自动加一个 \0 作为字符串结束标志 (字符被存在char数组中,指针需要知道到什么时候字符串结束,为兼容C语言,C++中所有的字符串字面值都由编译器自动在末尾添加一个空字符)
  3. 所以:'A'char字符类型;而"A"`‘A’ ,‘\0’` ,是字符串常量,是const char* 类型
  4. const chat * c = "abc" ; //(const少了编译器会警告 转化问题)

字符数组存储字符串(C风格的字符串)

C风格字符串是以空字符null结束的字符数组

  1. char ca1[]={'C', '+', '+'}; // no null, not C-style string
  2. char ca2[]={'C', '+', '+', '\0'}; // explicit null
  3. char ca3[]="C++"; // null terminator added automatically
  4. const char *cp="C++"; // null terminator added automatically
  5. char *cp1=ca1; // points to first element of a array, but not C-style string
  6. char *cp2=ca2; // points to first element of a null-terminated char array
  7. ca1cp1都不是C风格字符串:ca1是一个不带结束符null的字符数组,而指针cp1指向ca1,因此,它指向的并不是以null结束的数组。

一些用于操作C风格字符串的标准库函数定义在cstring头文件中:

长度strlen(p) ;比较strcmp(p1,p2) ;追加strcat(p1,p2) ;复制strcpy(p1,p2)

用字符数组表示字符串的缺点:

  • 执行连接、拷贝、比较等操作,都需要显式调用库函数,很麻烦
  • 当字符串长度很不确定时,需要用new动态创建字符数组,最后要用delete释放,很繁琐
  • 字符串实际长度大于为它分配的空间时,会产生数组下标越界的错误

字符串 - 图2 尽管C支持C风格字符串,但在C程序中最好不要使用它们。 使用下面的string类。

标准C类库中的String类(C风格的字符串)(容器)

  1. string s

C++11里面规定std::string一定是以’\0’结尾,但是这个空字符不计入_size

  1. string str("abc");
  2. cout<<str.size()<<" val1--val2 "<<(str[3]=='\0'? "true":"false")<<endl;
  3. 结果:3 val1--val2 true

三、string与char的转化

  1. const char *aa = "this-"; //正确,等式左右类型完全相等
  2. char *bb = "is-"; //编译器警告:
  3. //warning: ISO C++ forbids converting a string constant to 'char*' [-Wwrite-strings] 但是值还是正确的
  4. char *bb2 = (char*)"is-"; //这是上一个语句的安全写法(显示类型转化)。const char*是不能直接赋值到char*的,这样编译都不能通过,理由:假如可以的话,那么通过char*就可以修改const char指向的内容了,这是不允许的。所以char*要另外开辟新的空间,即上面的形式。
  5. char cc[] = "a-"; //正确,字符数组末尾是'\0'
  6. char dd[] = {'w','o','r','d'}; // 危险,非C风格的字符串,因为末尾没有'\0',导致cout不知何时结束,输出错误。
  7. cout<<aa<<bb<<cc<<dd<<endl; // 输出:this-is-a-worda- 多出了最后的a-
  8. //当在dd最后添加元素'\0' 之后就输出正确了。

1、string转char*

  1. string str = "hello";
  2. const char* p = str.data();//加const 或者用char * p=(char*)str.data();的形式
  3. string str="world";
  4. const char *p = str.c_str();//同上,要加const或者等号右边用char*
  5. string str="hmmm";
  6. char p[50];
  7. str.copy(p, 5, 0);//这里5代表复制几个字符,0代表复制的位置,
  8. *(p+5)=‘\0’;//注意手动加结束符!!!

data返回的char c_str返回的const char 除此之外好像没啥区别

2、char * 转string

直接赋值

  1. char *p = "hello";//直接赋值
  2. string s(p);

这里有一点要说明,当声明了string类型变量s后,用printf(“%s”,s);是会出错的,因为“%s”要求后面的对象的首地址。但是string不是这样的一个类型。所以肯定出错。可以传入p.c_str()

3、string转char[]

  1. string pp = "dagah";
  2. char p[8];
  3. int i;
  4. for( i=0;i<pp.size();i++)
  5. p[i] = pp[i];
  6. p[i] = '\0'; //记得在末尾加上空字符
  7. printf("%s\n",p);
  8. cout<<p;

四、string类操作

string 类是 STL 中 basic_string 模板实例化得到的模板类。其定义如下:

typedef basic_string string;

basic_string 此处可以不必深究。

string 类的成员函数有很多,同一个名字的函数也常会有五六个重载的版本。篇幅所限,不能将这些原型一一列出并加以解释。这里仅对常用成员函数按功能进行分类,并直接给出应用的例子,通过例子,读者可以基本掌握这些成员函数的用法。

要想更深入地了解 string 类,还要阅读 C++ 的参考手册或编译器自带的联机资料。对于前面介绍过的字符串处理的内容,这里不再重复说明。

1. 构造函数

string 类有多个构造函数,用法示例如下:

  1. string s1(); // si = ""
  2. string s2("Hello"); // s2 = "Hello"
  3. string s3(4, 'K'); // s3 = "KKKK"
  4. string s4("12345", 1, 3); //s4 = "234",即 "12345" 的从下标 1 开始,长度为 3 的子串

为称呼方便,本教程后文将从字符串下标 n 开始、长度为 m 的字符串称为“子串(n, m)”。

string 类没有接收一个整型参数或一个字符型参数的构造函数。下面的两种写法是错误的:

  1. string s1('K');
  2. string s2(123);

2. 对 string 对象赋值

可以用 char* 类型的变量、常量,以及 char 类型的变量、常量对 string 对象进行赋值。例如:

  1. string s1,s2;
  2. s1 = "Hello"; // s1 = "Hello"
  3. s2 = 'K'; // s2 = "K”

string 类还有 assign 成员函数,可以用来对 string 对象赋值。assign 成员函数返回对象自身的引用。例如:

  1. string s1("12345"), s2;
  2. s3.assign(s1); // s3 = s1
  3. s2.assign(s1, 1, 2); // s2 = "23",即 s1 的子串(1, 2)
  4. s2.assign(4, 'K'); // s2 = "KKKK"
  5. s2.assign("abcde", 2, 3); // s2 = "cde",即 "abcde" 的子串(2, 3)

3. 求字符串的长度

length 成员函数返回字符串的长度。size 成员函数可以实现同样的功能。

4. string对象中字符串的连接

除了可以使用 + 和 += 运算符对 string 对象执行字符串的连接操作外,string 类还有 append 成员函数,可以用来向字符串后面添加内容。append 成员函数返回对象自身的引用。例如:

  1. string s1("123"), s2("abc");
  2. s1.append(s2); // s1 = "123abc"
  3. s1.append(s2, 1, 2); // s1 = "123abcbc"
  4. s1.append(3, 'K'); // s1 = "123abcbcKKK"
  5. s1.append("ABCDE", 2, 3); // s1 = "123abcbcKKKCDE",添加 "ABCDE" 的子串(2, 3)

5. string对象的比较

除了可以用 <、<=、==、!=、>=、> 运算符比较 string 对象外,string 类还有 compare 成员函数,可用于比较字符串。compare 成员函数有以下返回值:

  • 小于 0 表示当前的字符串小;
  • 等于 0 表示两个字符串相等;
  • 大于 0 表示另一个字符串小。
  1. string s1("hello"), s2("hello, world");
  2. int n = s1.compare(s2);
  3. n = s1.compare(1, 2, s2, 0, 3); //比较s1的子串 (1,2) 和s2的子串 (0,3)
  4. n = s1.compare(0, 2, s2); // 比较s1的子串 (0,2) 和 s2
  5. n = s1.compare("Hello");
  6. n = s1.compare(1, 2, "Hello"); //比较 s1 的子串(1,2)和"Hello”
  7. n = s1.compare(1, 2, "Hello", 1, 2); //比较 s1 的子串(1,2)和 "Hello" 的子串(1,2)

6. 求 string 对象的子串

substr 成员函数可以用于求子串 (n, m),原型如下:

  1. string substr(int n = 0, int m = string::npos) const;

调用时,如果省略 m 或 m 超过了字符串的长度,则求出来的子串就是从下标 n 开始一直到字符串结束的部分。例如: 注意m是长度

  1. string s1 = "this is ok";
  2. string s2 = s1.substr(2, 4); // s2 = "is i"
  3. s2 = s1.substr(2); // s2 = "is is ok"

7. 交换两个string对象的内容

swap 成员函数可以交换两个 string 对象的内容。例如:

  1. string s1("West”), s2("East");
  2. s1.swap(s2); // s1 = "East",s2 = "West"

8. 查找子串和字符

string 类有一些查找子串和字符的成员函数,它们的返回值都是子串或字符在 string 对象字符串中的位置(即下标)。如果查不到,则返回 string::npos。string: :npos 是在 string 类中定义的一个静态常量。这些函数如下:

  • find:从前往后查找子串或字符出现的位置。
  • rfind:从后往前查找子串或字符出现的位置。
  • find_first_of:从前往后查找何处出现另一个字符串中包含的字符。例如:
    • s1.find_first_of(“abc”); //查找s1中第一次出现”abc”中任一字符的位置
  • find_last_of:从后往前查找何处出现另一个字符串中包含的字符。
  • find_first_not_of:从前往后查找何处出现另一个字符串中没有包含的字符。
  • find_last_not_of:从后往前查找何处出现另一个字符串中没有包含的字符。

下面是 string 类的查找成员函数的示例程序。

  1. #include <iostream>
  2. #include <string>
  3. using namespace std;
  4. int main()
  5. {
  6. string s1("Source Code");
  7. int n;
  8. if ((n = s1.find('u')) != string::npos) //查找 u 出现的位置
  9. cout << "1) " << n << "," << s1.substr(n) << endl;
  10. //输出 l)2,urce Code
  11. if ((n = s1.find("Source", 3)) == string::npos)
  12. //从下标3开始查找"Source",找不到
  13. cout << "2) " << "Not Found" << endl; //输出 2) Not Found
  14. if ((n = s1.find("Co")) != string::npos)
  15. //查找子串"Co"。能找到,返回"Co"的位置
  16. cout << "3) " << n << ", " << s1.substr(n) << endl;
  17. //输出 3) 7, Code
  18. if ((n = s1.find_first_of("ceo")) != string::npos)
  19. //查找第一次出现或 'c'、'e'或'o'的位置
  20. cout << "4) " << n << ", " << s1.substr(n) << endl;
  21. //输出 4) l, ource Code
  22. if ((n = s1.find_last_of('e')) != string::npos)
  23. //查找最后一个 'e' 的位置
  24. cout << "5) " << n << ", " << s1.substr(n) << endl; //输出 5) 10, e
  25. if ((n = s1.find_first_not_of("eou", 1)) != string::npos)
  26. //从下标1开始查找第一次出现非 'e'、'o' 或 'u' 字符的位置
  27. cout << "6) " << n << ", " << s1.substr(n) << endl;
  28. //输出 6) 3, rce Code
  29. return 0;
  30. }

9. 替换子串

replace 成员函数可以对 string 对象中的子串进行替换,返回值为对象自身的引用。例如:

  1. string s1("Real Steel");
  2. s1.replace(1, 3, "123456", 2, 4); //用 "123456" 的子串(2,4) 替换 s1 的子串(1,3)
  3. cout << s1 << endl; //输出 R3456 Steel
  4. string s2("Harry Potter");
  5. s2.replace(2, 3, 5, '0'); //用 5 个 '0' 替换子串(2,3)
  6. cout << s2 << endl; //输出 HaOOOOO Potter
  7. int n = s2.find("OOOOO"); //查找子串 "00000" 的位置,n=2
  8. s2.replace(n, 5, "XXX"); //将子串(n,5)替换为"XXX"
  9. cout << s2 < < endl; //输出 HaXXX Potter

10. 删除子串

erase 成员函数可以删除 string 对象中的子串,返回值为对象自身的引用。例如:

  1. string s1("Real Steel");
  2. s1.erase(1, 3); //删除子串(1, 3),此后 s1 = "R Steel"
  3. s1.erase(5); //删除下标5及其后面的所有字符,此后 s1 = "R Ste"

11. 插入字符串

insert 成员函数可以在 string 对象中插入另一个字符串,返回值为对象自身的引用。例如:

  1. string s1("Limitless"), s2("00");
  2. s1.insert(2, "123"); //在下标 2 处插入字符串"123",s1 = "Li123mitless"
  3. s1.insert(3, s2); //在下标 2 处插入 s2 , s1 = "Li10023mitless"
  4. s1.insert(3, 5, 'X'); //在下标 3 处插入 5 个 'X',s1 = "Li1XXXXX0023mitless"

12. 将 string 对象作为流处理

使用流对象 istringstream 和 ostringstream,可以将 string 对象当作一个流进行输入输出。使用这两个类需要包含头文件 sstream。

示例程序如下:

  1. #include <iostream>
  2. #include <sstream>
  3. #include <string>
  4. using namespace std;
  5. int main()
  6. {
  7. string src("Avatar 123 5.2 Titanic K");
  8. istringstream istrStream(src); //建立src到istrStream的联系
  9. string s1, s2;
  10. int n; double d; char c;
  11. istrStream >> s1 >> n >> d >> s2 >> c; //把src的内容当做输入流进行读取
  12. ostringstream ostrStream;
  13. ostrStream << s1 << endl << s2 << endl << n << endl << d << endl << c <<endl;
  14. cout << ostrStream.str();
  15. return 0;
  16. }

程序的输出结果是:
Avatar
Titanic
123
5.2
K

第 11 行,从输入流 istrStream 进行读取,过程和从 cin 读取一样,只不过输入的来源由键盘变成了 string 对象 src。因此,”Avatar” 被读取到 s1,123 被读取到 n,5.2 被读取到 d,”Titanic” 被读取到s2,’K’ 被读取到 c。

第 12 行,将变量的值输出到流 ostrStream。输出结果不会出现在屏幕上,而是被保存在 ostrStream 对象管理的某处。用 ostringstream 类的 str 成员函数能将输出到 ostringstream 对象中的内容提取出来。

13. 用 STL 算法操作 string 对象

string 对象也可以看作一个顺序容器,它支持随机访问迭代器,也有 begin 和 end 等成员函数。STL 中的许多算法也适用于 string 对象。下面是用 STL 算法操作 string 对象的程序示例。

  1. #include <iostream>
  2. #include <algorithm>
  3. #include <string>
  4. using namespace std;
  5. int main()
  6. {
  7. string s("afgcbed");
  8. string::iterator p = find(s.begin(), s.end(), 'c');
  9. if (p!= s.end())
  10. cout << p - s.begin() << endl; //输出 3
  11. sort(s.begin(), s.end());
  12. cout << s << endl; //输出 abcdefg
  13. next_permutation(s.begin(), s.end());
  14. cout << s << endl; //输出 abcdegf
  15. return 0;
  16. }

五、C++处理中文字符

https://www.cnblogs.com/qzhforthelife/p/3228933.html