定义

字符串是用一对双引号”或反引号``(键盘数字1的左边键)括起来定义,

  1. str :="string test"
  2. fmt.Println(str)
  3. aStr := `another string`
  4. fmt.Println(aStr)

注意字符串一旦赋值了,字符串是不可以修改的。

  1. str :="hello"
  2. str[0] = 's'

会出现如下错误

  1. cannot assign to str[0]

如果需要修改字符串内容,可以把字符串转换成[]byte类型

  1. package main
  2. import "fmt"
  3. func main() {
  4. str :="hello"
  5. a :=[]byte(str)
  6. a[0] = 's'
  7. fmt.Println(str)
  8. fmt.Println(string(a))
  9. }

打印结果如下

  1. hello
  2. sello

字符串转换为切片 []byte(s)要慎用,尤其是当数据量较大时(每转换一次都需复制内容)

  1. <br />字符串的2种表现形式,双引号可以识别转义字符,单引号会按照原生输出。
  1. doubleStr := "adc\nnextLine"
  2. fmt.Println(doubleStr)
  3. singleSte := `\t adc\n nextLine`
  4. fmt.Println(singleSte)

底层结构

符串的底层结构在reflect.StringHeader中定义:

  1. //runtime/string .go
  2. type StringHeader struct {
  3. Data uintptr
  4. Len int
  5. }

字符串结构由两个信息组成:第一个是字符串指向的底层字节数组,第二个是字符串的字节的长度。字符串其实是一个结构体,因此字符串的赋值操作也就是reflect.StringHeader结构体的复制过程,并不会涉及底层字节数组的复制。在前面数组一节提到的[2]string字符串数组对应的底层结构和[2]reflect.StringHeader对应的底层结构是一样的,可以将字符串数组看作一个结构体数组。
我们可以看看字符串“Hello, world”本身对应的内存结构:
Go基础——字符串 - 图1

字符串操作

包含

  1. Contains(s, substr string) bool 包含子字符串
  2. ContainsAny(s, chars string) bool 任意点码值是否s中出现
  3. ContainsRune(s string, r rune) bool r unicode值是否s中出现
  4. Count(s, sep string) int sep 子字符串出现的次数
  5. EqualFold(s, t string) bool 比较字符串相等忽略大小写
  6. HasPrefix(s, prefix string) bool 是否有前缀
  7. HasSuffix(s, suffix string) bool 是否有后缀
  1. fmt.Println(strings.Contains("seafood", "foo"))//true
  2. fmt.Println(strings.Contains("seafood", "bar"))//false
  3. fmt.Println(strings.Contains("seafood", ""))//true
  4. fmt.Println(strings.Contains("", ""))//true
  5. fmt.Println(strings.ContainsAny("test",""))//false
  6. fmt.Println(strings.ContainsAny("test","tr"))//true
  7. fmt.Println(strings.Count("test", "t"))//2

位置

  1. Index(s, sep string) int 返回第一个seps中的位置
  2. IndexAny(s, chars string) int 返回charsunicode码点在s中第一个所在的位置
  3. IndexFunc(s string, f func(rune) bool) int 返回s unicode码点满足函数f的位置
  4. IndexByte(s string, c byte) int 返回第一个c bytes中出现的位置
  5. IndexRune(s string, r rune) int 返回第一个r unicodes中出现的位置
  6. LastIndex(s, sep string) int
  7. LastIndexAny(s, chars string)
  8. LastIndexFunc(s string, f func(rune)bool)int

过滤

  1. Trim(s string, cutset string) string 从两端过滤包含cutset中码点值
  2. TrimFunc(s string, f func(rune) bool)string从两端过滤满足f的码点值
  3. TrimLeft(s, string, cutset s string) string
  4. TrimLeftFunc(s string, f func(rune) bool)string
  5. TrimRight(s, string, cutset s string) string
  6. TrimRightFunc(s string, f func(rune) bool)string
  7. TrimSpace(s string) string 从两端过滤空白字符和空格

替换

  1. Map(mapping func(rune) rune, s string) string 根据mapping函数替换里面每个rune
  2. NewReplacer(oldnew string) 创建一个替换器对象
  3. Replace(s, old, new string, n int) string old 替换为new

大小写

  1. Title(s string) string s中每一个单词进行标题首字母大写
  2. ToTitle(s string) string 得到s的标题格式
  3. ToLower(s string) string 得到小写
  4. ToLowerSpeical(case unicode.SpecialCase, s string) string 针对特殊的编码格式小写
  5. ToUpper(s string) string
  6. ToUpperSpeical(case unicode.SpecialCase, s string) string

分割

  1. Fields(s string) []string 对字符串按空白进行分割
  2. FieldsFunc(s string, f func(rune) bool) 对满足f的函数进行切割
  3. Split(s, sep string) []string sep对字符串s进行分割
  4. SplitN(s, sep string, n int)[] string sep对字符串s进行分割成几部分
  5. SplitAfter(s, sep string) [] string
  6. SplitAfterN(s, sep string, n int)[] string
  7. TrimPrefix(s, prefix string) string 去掉前缀
  8. TrimSuffix(s, suffix string) string 去掉后缀

合并

  1. Join(a []string, sep string) string用分割符sep合并a
  2. NewReader(s string) *Reader 创建一个字符串对象
  3. Repeat(s string, count int) string 新生成一个s重复几次的字符串

转换

字符串转化的函数在strconv中,如下也只是列出一些常用的:
Append 系列函数将整数等转换为字符串后,添加到现有的字节数组中。

  1. package main
  2. import (
  3. "fmt"
  4. "strconv"
  5. )
  6. func main() {
  7. str := make([]byte, 0, 100)
  8. str = strconv.AppendInt(str, 4567, 10)
  9. str = strconv.AppendBool(str, false)
  10. str = strconv.AppendQuote(str, "abcdefg")
  11. str = strconv.AppendQuoteRune(str, '单')
  12. fmt.Println(string(str))
  13. }

Format 系列函数把其他类型的转换为字符串

  1. package main
  2. import (
  3. "fmt"
  4. "strconv"
  5. )
  6. func main() {
  7. a := strconv.FormatBool(false)
  8. b := strconv.FormatFloat(123.23, 'g', 12, 64)
  9. c := strconv.FormatInt(1234, 10)
  10. d := strconv.FormatUint(12345, 10)
  11. e := strconv.Itoa(1023)
  12. fmt.Println(a, b, c, d, e)
  13. }

Parse 系列函数把字符串转换为其他类型

  1. package main
  2. import (
  3. "fmt"
  4. "strconv"
  5. )
  6. func checkError(e error){
  7. if e != nil{
  8. fmt.Println(e)
  9. }
  10. }
  11. func main() {
  12. a, err := strconv.ParseBool("false")
  13. checkError(err)
  14. b, err := strconv.ParseFloat("123.23", 64)
  15. checkError(err)
  16. c, err := strconv.ParseInt("1234", 10, 64)
  17. checkError(err)
  18. d, err := strconv.ParseUint("12345", 10, 64)
  19. checkError(err)
  20. e, err := strconv.Atoi("1023")
  21. checkError(err)
  22. fmt.Println(a, b, c, d, e)
  23. }

遍历

range 在字符串中迭代 unicode 编码。第一个返回值是rune 的起始字节位置,然后第二个是 rune 自己。

  1. for index,value := range "123ABCabc"{
  2. fmt.Println(index,value)
  3. }

rune 类型

Go语言默认的字符编码就是UTF-8类型的 。
Go 内置两种字符类型 :
一种是byte的字节类类型( byte是uint的别名)。
另一种是表示Unicode编码的字符rune. rune在Go内部是int32类型的别名,占用4个字节。

  1. package main
  2. import "fmt"
  3. func main() {
  4. str := "Hello你好世界"
  5. fmt.Println(len(str))
  6. b := []byte(str)
  7. for _,v := range b{
  8. fmt.Print(string(v))
  9. }
  10. fmt.Println("")
  11. r :=[]rune(str)
  12. for _,v := range r{
  13. fmt.Print(string(v))
  14. }
  15. fmt.Println("")
  16. r[0]='h'
  17. r[5]='您'
  18. fmt.Println(string(r))
  19. }

打印结果如下

  1. 17
  2. Helloä½ å¥½ä¸�ç��
  3. Hello你好世界
  4. hello您好世界

格式化

通用占位符

占位符 说明 举例 输出
%v 相应值的默认格式。 Printf(“%v”, people) {zhangsan},
%+v 打印结构体时,会添加字段名 Printf(“%+v”, people) {Name:zhangsan}
%#v 相应值的Go语法表示 Printf(“#v”, people) main.Human{Name:”zhangsan”}
%T 相应值的类型的Go语法表示 Printf(“%T”, people) main.Human
%% 字面上的百分号,并非值的占位符 Printf(“%%”) %
%p 指针地址,十六进制表示,前缀 0x Printf(“%p”, &people) 0x4f57f0

字节切片

占位符 说明 举例 输出
%s 输出字符串表示(string类型或[]byte) Printf(“%s”, []byte(“Go语言”)) Go语言
%q 双引号围绕的字符串,由Go语法安全地转义 Printf(“%q”, “Go语言”) “Go语言”
%x 十六进制,小写字母,每字节两个字符 Printf(“%x”, “golang”) 676f6c616e67
%X 十六进制,大写字母,每字节两个字符 Printf(“%X”, “golang”) 676F6C616E67

数字

占位符 说明 举例 输出
%b 二进制表示 Printf(“%b”, 5) 101
%c 相应Unicode码点所表示的字符 Printf(“%c”, 0x4E2D)
%d 十进制表示 Printf(“%d”, 0x12) 18
%o 八进制表示 Printf(“%d”, 10) 12
%q 单引号围绕的字符字面值,由Go语法安全地转义 Printf(“%q”, 0x4E2D) ‘中’
%x 十六进制表示,字母形式为小写 a-f Printf(“%x”, 13) d
%X 十六进制表示,字母形式为大写 A-F Printf(“%x”, 13) D
%U Unicode格式:U+1234,等同于 “U+%04X” Printf(“%U”, 0x4E2D) U+4E2D%b 无小数部分的,指数为二的幂的科学计数法,与 strconv.FormatFloat 的 ‘b’ 转换格式一致。例如 -123456p-78
%e 科学计数法,例如 -1234.456e+78 Printf(“%e”, 10.2) 1.020000e+01
%E 科学计数法,例如 -1234.456E+78 Printf(“%e”, 10.2) 1.020000E+01
%f 有小数点而无指数,例如 123.456 Printf(“%f”, 10.2) 10.200000
%g 根据情况选择 %e 或 %f 以产生更紧凑的(无末尾的0)输出 Printf(“%g”, 10.20) 10.2
%G 根据情况选择 %E 或 %f 以产生更紧凑的(无末尾的0)输出 Printf(“%G”, 10.20+2i) ( 10.2+2i)