数据类型

基本类型
  • bool
  • string
  • int、int8、int16、int32、int64
  • uint、uint8、uint16、uint32、uint64、uintptr
  • byte (uint8 的别名)、rune (int32 的别名)
  • float32、float64
  • complex64、complex128 // 复数

    值类型
  • array、struct、string

    引用类型
  • slice、map、chan

    接口类型
  • interface

    函数类型
  • func


整数型 int

介绍
  1. Go语言同时提供了有符号和无符号的整数类型,内存对应 数字(bit)/8 大小的字节 :
    1. 有符号:int8、 int16、 int32 、 int64
    2. 无符号:uint8、uint16、uint32 、uint64
  2. 还有两种整数类型,它们分别对应特定 CPU 平台的字长(机器字大小),实际开发中由于编译器和计算机硬件的不同,他们所能表示的大小会在 32bit 或 64bit 之间变化:
    1. 有符号:int
    2. 无符号:uint
  3. uintptr 是无符号的整数类型,它没有指定具体的 bit 大小但是足以容纳指针。该类型只有在底层编程时才需要,特别是Go语言和C语言函数库或操作系统接口相交互的地方。
  4. rune 和 int32 是等价的,rune 通常用于表示一个 Unicode 码点。这两个名称可以互换使用。
  5. byte 和 uint8 是等价的,byte 通常用于强调数值是一个原始的数据而不是一个小的整数。

注意
  1. 大多数情况下,我们只需要 int 一种整型即可,它可以用于循环计数器(for 循环中控制循环次数的变量)、数组和切片的索引,以及任何通用目的的整型运算符,通常 int 类型的处理速度也是最快的。
  2. 尽管在某些特定的运行环境下 int、uint 和 uintptr 的大小可能相等,但是它们依然是不同的类型,比如 int 和 int32,虽然 int 类型的大小也可能是 32 bit,但是在需要把 int 类型当做 int32 类型使用的时候必须显示的对类型进行转换,反之亦然。
  3. Go语言中有符号整数采用 2 的补码形式表示,也就是最高 bit 位用来表示符号位,一个 n-bit 的有符号数的取值范围是从 -2 到 2-1。无符号整数的所有 bit 位都用于表示非负数,取值范围是 0 到 2-1。例如,int8 类型整数的取值范围是从 -128 到 127,而 uint8 类型整数的取值范围是从 0 到 255。可以从math包,查询,例: math.MaxInt32


哪些情况下使用 int 和 uint
  1. 程序逻辑对整型范围没有特殊需求。例如,对象的长度使用内建 len() 函数返回,这个长度可以根据不同平台的字节长度进行变化。实际使用中,切片或 map 的元素数量等都可以用 int 来表示。
  2. 在二进制传输、读写文件的结构描述时,为了保持文件的结构不会受到不同编译目标平台字节长度的影响,不要使用 int 和 uint。

浮点型 float

介绍
  1. Go语言提供了两种精度的浮点数 float32 和 float64,它们的算术规范由 IEEE754 浮点数国际标准定义,该浮点数规范被所有现代的 CPU 支持。
  2. 浮点数类型的取值范围可以从很微小到很巨大,极限值可以在 math 包中找到:
    1. float32:最小值:1.4e-45 最大值:常量 math.MaxFloat32,大约是 3.4e38,内存占用4字节。
    2. float64:最小值:4.9e-324 最大值:常量 math.MaxFloat64,大约是 1.8e308,内存占用8字节。
  3. 小数位精度不同:
    1. float32:6 个十进制数的精度
    2. float64:15 个十进制数的精度


注意
  1. 通常应该优先使用 float64 类型,因为 float32 类型的累计计算误差很容易扩散,并且 float32 能精确表示的正整数并不是很大。

    1. var f float32 = 16777216 // 1 << 24
    2. fmt.Println(f == f+1) // "true"!
  2. 浮点数在声明的时候可以只写整数部分或者小数部分,像下面这样:

    1. const e = .71828 // 0.71828
    2. const f = 1. // 1
  3. 很小或很大的数最好用科学计数法书写,通过 e 或 E 来指定指数部分:

    1. const Avogadro = 6.02214129e23 // 阿伏伽德罗常数
    2. const Planck = 6.62606957e-34 // 普朗克常数
  4. 用 Printf 函数打印浮点数时可以使用“%f”来控制保留几位小数:

    1. package main
    2. import (
    3. "fmt"
    4. "math"
    5. )
    6. func main() {
    7. fmt.Printf("%f\n", math.Pi) // 3.141593
    8. fmt.Printf("%.2f\n", math.Pi) // 3.14
    9. }

复数型 complex

介绍
  1. 复数是由两个浮点数表示的,其中一个表示实部(real),一个表示虚部(imag)。
  2. 复数的值由三部分组成 RE + IMi,其中 RE 是实数部分,IM 是虚数部分,RE 和 IM 均为 float 类型。最后的 i 是虚数单位。
  3. Go语言中复数的类型有两种:
    1. complex64(32 位实数和虚数,占用8字节)
    2. complex128(64 位实数和虚数,占用16字节)
  4. Go语言内置的 math/cmplx 包中提供了很多操作复数的公共方法,Go语言默认使用 complex128 类型,因为这些内置的包中都使用 complex128 类型作为参数。

声明
  1. 内置函数 complex(x, y) 来声明复数,x 为实部,y 为虚部,皆为 float64。
  2. 内置函数 real(z) 来获得复数的实部。
  3. 内置函数 imag(z) 来获得复数的虚部。
    1. var x complex128 = complex(1, 2) // 1+2i
    2. var y complex128 = complex(3, 4) // 3+4i
    3. fmt.Println(x*y) // "(-5+10i)"
    4. fmt.Println(real(x*y)) // "-5"
    5. fmt.Println(imag(x*y)) // "10"

    如果大家对复数的运算法则不是很了解,可以查阅《复数运算法则》,其中详细的讲解了复数的加减乘除操作。


布尔型 bool

介绍
  1. 布尔类型的值只有两种:true 或 false。不可以用数字代替。
  2. if 和 for 语句的条件部分都是布尔类型的值,并且==<等比较操作也会产生布尔型的值。
  3. 一元操作符!对应逻辑非操作,因此!true的值为 false。
  4. 在内存中占用1个字节。

注意
  1. Go语言对于值之间的比较有非常严格的限制,如果以下条件都不满足,则必须将其中一个值的类型转换为和另外一个值的类型相同之后才可以进行比较:
    1. 只有两个相同类型的值才可以进行比较。
    2. 如果值的类型是接口(interface),那么它们也必须都实现了相同的接口。
    3. 如果其中一个值是常量,那么另外一个值可以不是常量,但是类型必须和该常量类型相同。
  2. 布尔值可以和 &&(AND)和 ||(OR)操作符结合(&& 优先级比 || 高),并且有短路行为,如果运算符左边的值已经可以确定整个布尔表达式的值,那么运算符右边的值将不再被求值。

    1. s != "" && s[0] == 'x'
  3. 布尔型无法参与数值运算,也无法与其他类型进行转换。

    1. var n bool
    2. fmt.Println(int(n) * 2)

    会编译错误:cannot convert n (type bool) to type int


字符串 string

介绍
  1. 字符串可以包含任意数据,通常是用来包含可读的文本,使用””或``来定义。
  2. 字符串是一种值类型,且值不可变,即创建某个文本后将无法再次修改这个文本的内容,更深入地讲,字符串是字节的定长数组。
  3. 字符串是 UTF-8 字符的一个序列(当字符为 ASCII 码表上的字符时则占用 1 个字节,其它字符根据需要占用 2-4 个字节)。

UTF-8
  1. UTF-8 是一种被广泛使用的编码格式,是文本文件的标准编码,包括 XML 和 JSON 在内也都使用该编码。
  2. 由于该编码对占用字节长度的不定性::
    1. Go语言中字符串根据需要占用 1 至 4 个字节。
    2. 其它编程语言如 C++Java 或者 Python 不同(Java 始终使用 2 个字节)。
  3. Go语言这样做不仅减少了内存和硬盘空间占用,同时也不用像其它语言那样需要对使用 UTF-8 字符集的文本进行编码和解码。

单行字符串(字符串字面量 string literal)
  1. 使用双引号书写字符串的方式是字符串常见表达方式之一,双引号字面量不能跨行。

    1. s := "hello word!"

    多行字符串
  2. 使用反引号书写字符串的方式也是字符串常见表达方式之一,反引号字面量可以跨行。

  3. 反引号间换行将被作为字符串中的换行,但是所有的转义字符均无效,文本将会原样输出。
  4. 多行字符串一般用于内嵌源码和内嵌数据等,立马所有内容均不会被编译器识别,而只是作为字符串的一部分。
    1. const str = `第一行
    2. 第二行
    3. 第三行
    4. \r\n
    5. `
    6. fmt.Println(str)
    转译
    字符串中可以使用转义字符来实现换行、缩进等效果,常用的转义字符包括:
  • \n:换行符
  • \r:回车符
  • \t:tab 键
  • \u 或 \U:Unicode 字符
  • \:反斜杠自身

注意
  1. 一般的比较运算符(==、!=、<、<=、>=、>)是通过在内存中按字节比较来实现字符串比较的,因此比较的结果是字符串自然编码的顺序。
  2. 字符串的内容(纯字节)可以通过标准索引法来获取,在方括号[ ]内写入索引,索引从 0 开始计数:
    1. 这种转换方案只对纯 ASCII 码的字符串有效。
    2. 获取字符串中某个字节的地址属于非法行为,例如 &str[i]。
      1. str[0] // 第 1 个字节
      2. str[i - 1] // 第 i 个字节
      3. str[len(str)-1] // 最后 1 个字节
      拼接符
      1. +
      两个字符串 s1 和 s2 可以通过 s := s1 + s2 拼接在一起。将 s2 追加到 s1 尾部并生成一个新的字符串 s:
      1. str := "Beginning of the string " +
      2. "second part of the string"

      提示:因为编译器会在行尾自动补全分号,所以拼接字符串用的加号“+”必须放在第一行末尾。

2. +=
  1. s := "hel" + "lo,"
  2. s += "world!"
  3. fmt.Println(s) //输出 “hello, world!”

其他

字符串类型在业务中的应用可以说是最广泛的,读者需要详细了解字符串的常见用法,请猛击下面的文章:


字符类型 byte 和 rune

介绍
  1. 字符串中的每一个元素叫做“字符”,在遍历或者单个获取字符串元素时可以叫做字符。字符使用单引号括起来。
  2. Go语言的字符有以下两种:

    1. byte 类型(或者叫 uint8 类型),代表了 ASCII 码的一个字符。
    2. rune 类型(等价于 int32 类型),代表一个 UTF-8 字符,当需要处理中文、日文或者其他复合字符时,则需要用到 rune 类型。
      byte
  3. ASCII 码表中,下面的写法是等效的:

    1. var ch byte = 65
    2. var ch byte = '\377' //(\ 后面紧跟着长度为 3 的 8 进制数)
    3. var ch byte = '\x41' //(\x 后面紧跟着长度为 2 的 16 进制数)

    rune
  4. Go语言同样支持 Unicode(UTF-8),因此字符同样称为 Unicode 代码点或者 runes,并在内存中使用 int 来表示。在文档中,一般使用格式 U+hhhh 来表示,其中 h 表示一个 16 进制数。

  5. 在书写 Unicode 字符时,需要在 16 进制数之前加上前缀\u或者\U。因为 Unicode 至少占用 2 个字节,所以我们使用 int16 或者 int 类型来表示。如果需要使用到 4 字节,则使用\u前缀,如果需要使用到 8 个字节,则使用\U前缀。
  6. Unicode 包中内置了一些用于测试字符的函数,这些函数的返回值都是一个布尔值:
    • 判断是否为字母:unicode.IsLetter(c)
    • 判断是否为数字:unicode.IsDigit(c)
    • 判断是否为空白符号:unicode.IsSpace(c) ```go var ch int = ‘\u0041’ var ch2 int = ‘\u03B2’ var ch3 int = ‘\U00101234’ fmt.Printf(“%d - %d - %d\n”, ch, ch2, ch3) // integer fmt.Printf(“%c - %c - %c\n”, ch, ch2, ch3) // character fmt.Printf(“%X - %X - %X\n”, ch, ch2, ch3) // UTF-8 bytes fmt.Printf(“%U - %U - %U”, ch, ch2, ch3) // UTF-8 code point

// log 65 - 946 - 1053236 A - β - r 41 - 3B2 - 101234 U+0041 - U+03B2 - U+101234

  1. <a name="oFBI5"></a>
  2. ##### UTF-8 和 Unicode 有何区别?
  3. 广义的 Unicode 指的是一个标准,定义字符集及编码规则,即 Unicode 字符集和 UTF-8、UTF-16 编码等。
  4. <a name="Vawc7"></a>
  5. ###### Unicode
  6. 1. Unicode 与 ASCII 类似,都是一种字符集。
  7. 1. 字符集为每个字符分配一个唯一的 ID,我们使用到的所有字符在 Unicode 字符集中都有一个唯一的 ID,例如上面例子中的 a 在 Unicode 与 ASCII 中的编码都是 97。汉字“你”在 Unicode 中的编码为 20320,在不同国家的字符集中,字符所对应的 ID 也会不同。而无论任何情况下,Unicode 中的字符的 ID 都是不会变化的。
  8. <a name="tGYJZ"></a>
  9. ###### UTF-8
  10. 1. UTF-8 是编码规则,将 Unicode 中字符的 ID 以某种方式进行编码,UTF-8 的是一种变长编码规则,从 1 到 4 个字节不等。编码规则如下:
  11. 1. 0xxxxxx 表示文字符号 0~127,兼容 ASCII 字符集。
  12. 1. 从 128 到 0x10ffff 表示其他字符。
  13. 2. 根据这个规则,拉丁文语系的字符编码一般情况下每个字符占用一个字节,而中文每个字符占用 3 个字节。
  14. <br />
  15. ---
  16. <a name="cdENJ"></a>
  17. ###
  18. <a name="CivIt"></a>
  19. ## 类型转换
  20. <a name="cQHRm"></a>
  21. ### 介绍
  22. 1. 在必要以及可行的情况下,一个类型的值可以被转换成另一种类型的值。由于Go语言不存在隐式类型转换,因此所有的类型转换都必须显式的声明。
  23. 1. 类型转换只能在定义正确的情况下转换成功,例如从一个取值范围较小的类型转换到一个取值范围较大的类型(将 int16 转换为 int32)。当从一个取值范围较大的类型转换到取值范围较小的类型时(将 int32 转换为 int16 或将 float32 转换为 int),会发生精度丢失(截断)的情况。
  24. 1. 只有相同底层类型的变量之间可以进行相互转换(如将 int16 类型转换成 int32 类型),不同底层类型的变量相互转换时会引发编译错误(如将 bool 类型转换为 int 类型)。
  25. 1. 浮点数在转换为整型时,会将小数部分去掉,只保留整数部分。
  26. <a name="Vikke"></a>
  27. ### 使用
  28. ```go
  29. valueOfTypeB = typeB(valueOfTypeA)
  30. // demo
  31. a := 5.0
  32. b := int(a)

不同类型转换

To 系列

  1. string转成int
  2. func Atoi(s string) (i int, err error)
  3. int转成string
  4. func Itoa(i int) string

Parse 系列

  1. Parse 系列函数都有两个返回值,第一个返回值是转换后的值,第二个返回值为转化失败的错误信息。
  2. 返回的 err 是 *NumErr 类型的,如果语法有误,err.Error = ErrSyntax,如果结果超出类型范围 err.Error = ErrRange。 ```go string转成int64: // base 指定进制,取值范围是 2 到 36。如果 base 为 0,则会从字符串前置判断,“0x”是 16 进制,“0”是 8 进制,否则是 10 进制。 // bitSize 指定结果必须能无溢出赋值的整数类型,0、8、16、32、64 分别代表 int、int8、int16、int32、int64。 func ParseInt(s string, base int, bitSize int) (i int64, err error) // demo: i, err := strconv.ParseInt(“-10”, 10, 64)

string转成uint64: // base,bitSize 同 ParseInt() func ParseUint(s string, base int, bitSize int) (n uint64, err error) // demo: i, err := strconv.ParseInt(“10”, 10, 64)

string转成bool: // 只能接受 1、0、t、f、T、F、true、false、True、False、TRUE、FALSE,其它的值均返回错误 bool,err := strconv.ParseBool(string)

string转成float64: // bitSize 指定了返回值的类型,32 表示 float32,64 表示 float64。 func ParseFloat(s string, bitSize int) (f float64, err error)

  1. <a name="QSAc8"></a>
  2. #### Format 系列
  3. Format 系列函数实现了将给定类型数据格式化为字符串类型的功能。
  4. ```go
  5. int64转成string
  6. // 参数 base 必须在 2 到 36 之间,返回结果中会使用小写字母“a”到“z”表示大于 10 的数字。
  7. func FormatInt(i int64, base int) string
  8. uint64转成string
  9. // base 同 FormatInt()
  10. func FormatUint(i uint64, base int) string
  11. bool转成string
  12. func FormatBool(b bool) string
  13. float64转成string
  14. // fmt 表示格式,可以设置为“f”表示 -ddd.dddd、“b”表示 -ddddp±ddd,指数为二进制、“e”表示 -d.dddde±dd 十进制指数、“E”表示 -d.ddddE±dd 十进制指数、“g”表示指数很大时用“e”格式,否则“f”格式、“G”表示指数很大时用“E”格式,否则“f”格式。
  15. // prec 控制精度(排除指数部分):当参数 fmt 为“f”、“e”、“E”时,它表示小数点后的数字个数;当参数 fmt 为“g”、“G”时,它控制总的数字个数。如果 prec 为 -1,则代表使用最少数量的、但又必需的数字来表示 f。
  16. // bitSize 表示参数 f 的来源类型(32 表示 float32、64 表示 float64),会据此进行舍入。
  17. func FormatFloat(f float64, fmt byte, prec, bitSize int) string

append 系列

  1. Append 系列函数用于将指定类型转换成字符串后追加到一个切片中。
  2. Append 系列函数和 Format 系列函数的使用方法类似,只不过是将转换后的结果追加到一个切片中。 ```go package main import ( “fmt” “strconv” ) func main() { // 声明一个slice b10 := []byte(“int (base 10):”)

    // 将转换为10进制的string,追加到slice中 b10 = strconv.AppendInt(b10, -42, 10) fmt.Println(string(b10)) b16 := []byte(“int (base 16):”) b16 = strconv.AppendInt(b16, -42, 16) fmt.Println(string(b16)) }

// log int (base 10):-42 int (base 16):-2a ```