切片是 Go 中的一种基本的数据结构,使用这种结构可以用来管理数据集合。切片的设计想法是由动态数组概念而来,为了开发者可以更加方便的使一个数据结构可以自动增加和减少。但是切片本身并不是动态数据或者数组指针。切片常见的操作有 reslice、append、copy。与此同时,切片还具有可索引,可迭代的优秀特性。

一. 切片和数组

深入解析 Go 中 Slice 底层实现 - 图1

关于切片和数组怎么选择?接下来好好讨论讨论这个问题。

在 Go 中,与 C 数组变量隐式作为指针使用不同,Go 数组是值类型,赋值和函数传参操作都会复制整个数组数据。

  1. func main() {
  2. arrayA := [2]int{100, 200}
  3. var arrayB [2]int
  4. arrayB = arrayA
  5. fmt.Printf("arrayA : %p , %v\n", &arrayA, arrayA)
  6. fmt.Printf("arrayB : %p , %v\n", &arrayB, arrayB)
  7. testArray(arrayA)
  8. }
  9. func testArray(x [2]int) {
  10. fmt.Printf("func Array : %p , %v\n", &x, x)
  11. }

打印结果:

  1. arrayA : 0xc4200bebf0 , [100 200]
  2. arrayB : 0xc4200bec00 , [100 200]
  3. func Array : 0xc4200bec30 , [100 200]

可以看到,三个内存地址都不同,这也就验证了 Go 中数组赋值和函数传参都是值复制的。那这会导致什么问题呢?

假想每次传参都用数组,那么每次数组都要被复制一遍。如果数组大小有 100 万,在 64 位机器上就需要花费大约 800W 字节,即 8MB 内存。这样会消耗掉大量的内存。于是乎有人想到,函数传参用数组的指针。

  1. func main() {
  2. arrayA := [2]int{100, 200}
  3. testArrayPoint1(&arrayA)
  4. arrayB := arrayA[:]
  5. testArrayPoint2(&arrayB)
  6. fmt.Printf("arrayA : %p , %v\n", &arrayA, arrayA)
  7. }
  8. func testArrayPoint1(x *[2]int) {
  9. fmt.Printf("func Array : %p , %v\n", x, *x)
  10. (*x)[1] += 100
  11. }
  12. func testArrayPoint2(x *[]int) {
  13. fmt.Printf("func Array : %p , %v\n", x, *x)
  14. (*x)[1] += 100
  15. }

打印结果:

  1. func Array : 0xc4200b0140 , [100 200]
  2. func Array : 0xc4200b0180 , [100 300]
  3. arrayA : 0xc4200b0140 , [100 400]

这也就证明了数组指针确实到达了我们想要的效果。现在就算是传入 10 亿的数组,也只需要再栈上分配一个 8 个字节的内存给指针就可以了。这样更加高效的利用内存,性能也比之前的好。

不过传指针会有一个弊端,从打印结果可以看到,第一行和第三行指针地址都是同一个,万一原数组的指针指向更改了,那么函数里面的指针指向都会跟着更改。

切片的优势也就表现出来了。用切片传数组参数,既可以达到节约内存的目的,也可以达到合理处理好共享内存的问题。打印结果第二行就是切片,切片的指针和原来数组的指针是不同的。

由此我们可以得出结论:

把第一个大数组传递给函数会消耗很多内存,采用切片的方式传参可以避免上述问题。切片是引用传递,所以它们不需要使用额外的内存并且比使用数组更有效率。

但是,依旧有反例。

  1. package main
  2. import "testing"
  3. func array() [1024]int {
  4. var x [1024]int
  5. for i := 0; i < len(x); i++ {
  6. x[i] = i
  7. }
  8. return x
  9. }
  10. func slice() []int {
  11. x := make([]int, 1024)
  12. for i := 0; i < len(x); i++ {
  13. x[i] = i
  14. }
  15. return x
  16. }
  17. func BenchmarkArray(b *testing.B) {
  18. for i := 0; i < b.N; i++ {
  19. array()
  20. }
  21. }
  22. func BenchmarkSlice(b *testing.B) {
  23. for i := 0; i < b.N; i++ {
  24. slice()
  25. }
  26. }

我们做一次性能测试,并且禁用内联和优化,来观察切片的堆上内存分配的情况。

  1. go test -bench . -benchmem -gcflags "-N -l"

输出结果比较 “令人意外”:

  1. BenchmarkArray-4 500000 3637 ns/op 0 B/op 0 alloc s/op
  2. BenchmarkSlice-4 300000 4055 ns/op 8192 B/op 1 alloc s/op

解释一下上述结果,在测试 Array 的时候,用的是 4 核,循环次数是 500000,平均每次执行时间是 3637 ns,每次执行堆上分配内存总量是 0,分配次数也是 0 。

而切片的结果就 “差” 一点,同样也是用的是 4 核,循环次数是 300000,平均每次执行时间是 4055 ns,但是每次执行一次,堆上分配内存总量是 8192,分配次数也是 1 。

这样对比看来,并非所有时候都适合用切片代替数组,因为切片底层数组可能会在堆上分配内存,而且小数组在栈上拷贝的消耗也未必比 make 消耗大。

二. 切片的数据结构

切片本身并不是动态数组或者数组指针。它内部实现的数据结构通过指针引用底层数组,设定相关属性将数据读写操作限定在指定的区域内。切片本身是一个只读对象,其工作机制类似数组指针的一种封装

切片(slice)是对数组一个连续片段的引用,所以切片是一个引用类型(因此更类似于 C++ 中的 Vector 类型,或者 Python 中的 list 类型)。这个片段可以是整个数组,或者是由起始和终止索引标识的一些项的子集。需要注意的是,终止索引标识的项不包括在切片内。切片提供了一个与指向数组的动态窗口。

给定项的切片索引可能比相关数组的相同元素的索引小。和数组不同的是,切片的长度可以在运行时修改,最小为 0 最大为相关数组的长度:切片是一个长度可变的数组。

Slice 的数据结构定义如下:

  1. type slice struct {
  2. array unsafe.Pointer
  3. len int
  4. cap int
  5. }

深入解析 Go 中 Slice 底层实现 - 图2

切片的结构体由 3 部分构成,Pointer 是指向一个数组的指针,len 代表当前切片的长度,cap 是当前切片的容量。cap 总是大于等于 len 的。

深入解析 Go 中 Slice 底层实现 - 图3

如果想从 slice 中得到一块内存地址,可以这样做:

  1. s := make([]byte, 200)
  2. ptr := unsafe.Pointer(&s[0])

如果反过来呢?从 Go 的内存地址中构造一个 slice。

  1. var ptr unsafe.Pointer
  2. var s1 = struct {
  3. addr uintptr
  4. len int
  5. cap int
  6. }{ptr, length, length}
  7. s := *(*[]byte)(unsafe.Pointer(&s1))

构造一个虚拟的结构体,把 slice 的数据结构拼出来。

当然还有更加直接的方法,在 Go 的反射中就存在一个与之对应的数据结构 SliceHeader,我们可以用它来构造一个 slice

  1. var o []byte
  2. sliceHeader := (*reflect.SliceHeader)((unsafe.Pointer(&o)))
  3. sliceHeader.Cap = length
  4. sliceHeader.Len = length
  5. sliceHeader.Data = uintptr(ptr)

三. 创建切片

make 函数允许在运行期动态指定数组长度,绕开了数组类型必须使用编译期常量的限制。

创建切片有两种形式,make 创建切片,空切片。

1. make 和切片字面量

  1. func makeslice(et *_type, len, cap int) slice {
  2. maxElements := maxSliceCap(et.size)
  3. if len < 0 || uintptr(len) > maxElements {
  4. panic(errorString("makeslice: len out of range"))
  5. }
  6. if cap < len || uintptr(cap) > maxElements {
  7. panic(errorString("makeslice: cap out of range"))
  8. }
  9. p := mallocgc(et.size*uintptr(cap), et, true)
  10. return slice{p, len, cap}
  11. }

还有一个 int64 的版本:

  1. func makeslice64(et *_type, len64, cap64 int64) slice {
  2. len := int(len64)
  3. if int64(len) != len64 {
  4. panic(errorString("makeslice: len out of range"))
  5. }
  6. cap := int(cap64)
  7. if int64(cap) != cap64 {
  8. panic(errorString("makeslice: cap out of range"))
  9. }
  10. return makeslice(et, len, cap)
  11. }

实现原理和上面的是一样的,只不过多了把 int64 转换成 int 这一步罢了。

深入解析 Go 中 Slice 底层实现 - 图4

上图是用 make 函数创建的一个 len = 4, cap = 6 的切片。内存空间申请了 6 个 int 类型的内存大小。由于 len = 4,所以后面 2 个暂时访问不到,但是容量还是在的。这时候数组里面每个变量都是 0 。

除了 make 函数可以创建切片以外,字面量也可以创建切片。

深入解析 Go 中 Slice 底层实现 - 图5

这里是用字面量创建的一个 len = 6,cap = 6 的切片,这时候数组里面每个元素的值都初始化完成了。需要注意的是 [ ] 里面不要写数组的容量,因为如果写了个数以后就是数组了,而不是切片了。

深入解析 Go 中 Slice 底层实现 - 图6

还有一种简单的字面量创建切片的方法。如上图。上图就 Slice A 创建出了一个 len = 3,cap = 3 的切片。从原数组的第二位元素 (0 是第一位) 开始切,一直切到第四位为止(不包括第五位)。同理,Slice B 创建出了一个 len = 2,cap = 4 的切片。

2. nil 和空切片

nil 切片和空切片也是常用的。

  1. var slice []int

深入解析 Go 中 Slice 底层实现 - 图7

nil 切片被用在很多标准库和内置函数中,描述一个不存在的切片的时候,就需要用到 nil 切片。比如函数在发生异常的时候,返回的切片就是 nil 切片。nil 切片的指针指向 nil。

空切片一般会用来表示一个空的集合。比如数据库查询,一条结果也没有查到,那么就可以返回一个空切片。

  1. silce := make( []int , 0 )
  2. slice := []int{ }

深入解析 Go 中 Slice 底层实现 - 图8

空切片和 nil 切片的区别在于,空切片指向的地址不是 nil,指向的是一个内存地址,但是它没有分配任何内存空间,即底层元素包含 0 个元素。

最后需要说明的一点是。不管是使用 nil 切片还是空切片,对其调用内置函数 append,len 和 cap 的效果都是一样的。

四. 切片扩容

当一个切片的容量满了,就需要扩容了。怎么扩,策略是什么?

  1. func growslice(et *_type, old slice, cap int) slice {
  2. if raceenabled {
  3. callerpc := getcallerpc(unsafe.Pointer(&et))
  4. racereadrangepc(old.array, uintptr(old.len*int(et.size)), callerpc, funcPC(growslice))
  5. }
  6. if msanenabled {
  7. msanread(old.array, uintptr(old.len*int(et.size)))
  8. }
  9. if et.size == 0 {
  10. if cap < old.cap {
  11. panic(errorString("growslice: cap out of range"))
  12. }
  13. return slice{unsafe.Pointer(&zerobase), old.len, cap}
  14. }
  15. newcap := old.cap
  16. doublecap := newcap + newcap
  17. if cap > doublecap {
  18. newcap = cap
  19. } else {
  20. if old.len < 1024 {
  21. newcap = doublecap
  22. } else {
  23. for 0 < newcap && newcap < cap {
  24. newcap += newcap / 4
  25. }
  26. if newcap <= 0 {
  27. newcap = cap
  28. }
  29. }
  30. }
  31. var lenmem, newlenmem, capmem uintptr
  32. const ptrSize = unsafe.Sizeof((*byte)(nil))
  33. switch et.size {
  34. case 1:
  35. lenmem = uintptr(old.len)
  36. newlenmem = uintptr(cap)
  37. capmem = roundupsize(uintptr(newcap))
  38. newcap = int(capmem)
  39. case ptrSize:
  40. lenmem = uintptr(old.len) * ptrSize
  41. newlenmem = uintptr(cap) * ptrSize
  42. capmem = roundupsize(uintptr(newcap) * ptrSize)
  43. newcap = int(capmem / ptrSize)
  44. default:
  45. lenmem = uintptr(old.len) * et.size
  46. newlenmem = uintptr(cap) * et.size
  47. capmem = roundupsize(uintptr(newcap) * et.size)
  48. newcap = int(capmem / et.size)
  49. }
  50. if cap < old.cap || uintptr(newcap) > maxSliceCap(et.size) {
  51. panic(errorString("growslice: cap out of range"))
  52. }
  53. var p unsafe.Pointer
  54. if et.kind&kindNoPointers != 0 {
  55. p = mallocgc(capmem, nil, false)
  56. memmove(p, old.array, lenmem)
  57. memclrNoHeapPointers(add(p, newlenmem), capmem-newlenmem)
  58. } else {
  59. p = mallocgc(capmem, et, true)
  60. if !writeBarrier.enabled {
  61. memmove(p, old.array, lenmem)
  62. } else {
  63. for i := uintptr(0); i < lenmem; i += et.size {
  64. typedmemmove(et, add(p, i), add(old.array, i))
  65. }
  66. }
  67. }
  68. return slice{p, old.len, newcap}
  69. }

上述就是扩容的实现。主要需要关注的有两点,一个是扩容时候的策略,还有一个就是扩容是生成全新的内存地址还是在原来的地址后追加。

1. 扩容策略

先看看扩容策略。

  1. func main() {
  2. slice := []int{10, 20, 30, 40}
  3. newSlice := append(slice, 50)
  4. fmt.Printf("Before slice = %v, Pointer = %p, len = %d, cap = %d\n", slice, &slice, len(slice), cap(slice))
  5. fmt.Printf("Before newSlice = %v, Pointer = %p, len = %d, cap = %d\n", newSlice, &newSlice, len(newSlice), cap(newSlice))
  6. newSlice[1] += 10
  7. fmt.Printf("After slice = %v, Pointer = %p, len = %d, cap = %d\n", slice, &slice, len(slice), cap(slice))
  8. fmt.Printf("After newSlice = %v, Pointer = %p, len = %d, cap = %d\n", newSlice, &newSlice, len(newSlice), cap(newSlice))
  9. }

输出结果:

  1. Before slice = [10 20 30 40], Pointer = 0xc4200b0140, len = 4, cap = 4
  2. Before newSlice = [10 20 30 40 50], Pointer = 0xc4200b0180, len = 5, cap = 8
  3. After slice = [10 20 30 40], Pointer = 0xc4200b0140, len = 4, cap = 4
  4. After newSlice = [10 30 30 40 50], Pointer = 0xc4200b0180, len = 5, cap = 8

用图表示出上述过程。

深入解析 Go 中 Slice 底层实现 - 图9

从图上我们可以很容易的看出,新的切片和之前的切片已经不同了,因为新的切片更改了一个值,并没有影响到原来的数组,新切片指向的数组是一个全新的数组。并且 cap 容量也发生了变化。这之间究竟发生了什么呢?

Go 中切片扩容的策略是这样的:

  • 首先判断,如果新申请容量(cap)大于 2 倍的旧容量(old.cap),最终容量(newcap)就是新申请的容量(cap)
  • 否则判断,如果旧切片的长度小于 1024,则最终容量 (newcap) 就是旧容量 (old.cap) 的两倍,即(newcap=doublecap)
  • 否则判断,如果旧切片长度大于等于 1024,则最终容量(newcap)从旧容量(old.cap)开始循环增加原来的 1/4,即(newcap=old.cap,for {newcap += newcap/4})直到最终容量(newcap)大于等于新申请的容量 (cap),即(newcap >= cap)
  • 如果最终容量(cap)计算值溢出,则最终容量(cap)就是新申请容量(cap)

~ 如果切片的容量小于 1024 个元素,于是扩容的时候就翻倍增加容量。上面那个例子也验证了这一情况,总容量从原来的 4 个翻倍到现在的 8 个。~

~ 一旦元素个数超过 1024 个元素,那么增长因子就变成 1.25 ,即每次增加原来容量的四分之一。~

注意:扩容扩大的容量都是针对原来的容量而言的,而不是针对原来数组的长度而言的。

2. 新数组 or 老数组 ?

再谈谈扩容之后的数组一定是新的么?这个不一定,分两种情况。

情况一:

  1. func main() {
  2. array := [4]int{10, 20, 30, 40}
  3. slice := array[0:2]
  4. newSlice := append(slice, 50)
  5. fmt.Printf("Before slice = %v, Pointer = %p, len = %d, cap = %d\n", slice, &slice, len(slice), cap(slice))
  6. fmt.Printf("Before newSlice = %v, Pointer = %p, len = %d, cap = %d\n", newSlice, &newSlice, len(newSlice), cap(newSlice))
  7. newSlice[1] += 10
  8. fmt.Printf("After slice = %v, Pointer = %p, len = %d, cap = %d\n", slice, &slice, len(slice), cap(slice))
  9. fmt.Printf("After newSlice = %v, Pointer = %p, len = %d, cap = %d\n", newSlice, &newSlice, len(newSlice), cap(newSlice))
  10. fmt.Printf("After array = %v\n", array)
  11. }

打印输出:

  1. Before slice = [10 20], Pointer = 0xc4200c0040, len = 2, cap = 4
  2. Before newSlice = [10 20 50], Pointer = 0xc4200c0060, len = 3, cap = 4
  3. After slice = [10 30], Pointer = 0xc4200c0040, len = 2, cap = 4
  4. After newSlice = [10 30 50], Pointer = 0xc4200c0060, len = 3, cap = 4
  5. After array = [10 30 50 40]

把上述过程用图表示出来,如下图。

深入解析 Go 中 Slice 底层实现 - 图10

通过打印的结果,我们可以看到,在这种情况下,扩容以后并没有新建一个新的数组,扩容前后的数组都是同一个,这也就导致了新的切片修改了一个值,也影响到了老的切片了。并且 append() 操作也改变了原来数组里面的值。一个 append() 操作影响了这么多地方,如果原数组上有多个切片,那么这些切片都会被影响!无意间就产生了莫名的 bug!

这种情况,由于原数组还有容量可以扩容,所以执行 append() 操作以后,会在原数组上直接操作,所以这种情况下,扩容以后的数组还是指向原来的数组。

这种情况也极容易出现在字面量创建切片时候,第三个参数 cap 传值的时候,如果用字面量创建切片,cap 并不等于指向数组的总容量,那么这种情况就会发生。

  1. slice := array[1:2:3]

上面这种情况非常危险,极度容易产生 bug 。

建议用字面量创建切片的时候,cap 的值一定要保持清醒,避免共享原数组导致的 bug。

情况二:

情况二其实就是在扩容策略里面举的例子,在那个例子中之所以生成了新的切片,是因为原来数组的容量已经达到了最大值,再想扩容, Go 默认会先开一片内存区域,把原来的值拷贝过来,然后再执行 append() 操作。这种情况丝毫不影响原数组。

所以建议尽量避免情况一,尽量使用情况二,避免 bug 产生。

五. 切片拷贝

Slice 中拷贝方法有 2 个。

  1. func slicecopy(to, fm slice, width uintptr) int {
  2. if fm.len == 0 || to.len == 0 {
  3. return 0
  4. }
  5. n := fm.len
  6. if to.len < n {
  7. n = to.len
  8. }
  9. if width == 0 {
  10. return n
  11. }
  12. if raceenabled {
  13. callerpc := getcallerpc(unsafe.Pointer(&to))
  14. pc := funcPC(slicecopy)
  15. racewriterangepc(to.array, uintptr(n*int(width)), callerpc, pc)
  16. racereadrangepc(fm.array, uintptr(n*int(width)), callerpc, pc)
  17. }
  18. if msanenabled {
  19. msanwrite(to.array, uintptr(n*int(width)))
  20. msanread(fm.array, uintptr(n*int(width)))
  21. }
  22. size := uintptr(n) * width
  23. if size == 1 {
  24. *(*byte)(to.array) = *(*byte)(fm.array)
  25. } else {
  26. memmove(to.array, fm.array, size)
  27. }
  28. return n
  29. }

在这个方法中,slicecopy 方法会把源切片值 (即 fm Slice) 中的元素复制到目标切片 (即 to Slice ) 中,并返回被复制的元素个数,copy 的两个类型必须一致。slicecopy 方法最终的复制结果取决于较短的那个切片,当较短的切片复制完成,整个复制过程就全部完成了。

深入解析 Go 中 Slice 底层实现 - 图11

举个例子,比如:

  1. func main() {
  2. array := []int{10, 20, 30, 40}
  3. slice := make([]int, 6)
  4. n := copy(slice, array)
  5. fmt.Println(n,slice)
  6. }

还有一个拷贝的方法,这个方法原理和 slicecopy 方法类似,不在赘述了,注释写在代码里面了。

  1. func slicestringcopy(to []byte, fm string) int {
  2. if len(fm) == 0 || len(to) == 0 {
  3. return 0
  4. }
  5. n := len(fm)
  6. if len(to) < n {
  7. n = len(to)
  8. }
  9. if raceenabled {
  10. callerpc := getcallerpc(unsafe.Pointer(&to))
  11. pc := funcPC(slicestringcopy)
  12. racewriterangepc(unsafe.Pointer(&to[0]), uintptr(n), callerpc, pc)
  13. }
  14. if msanenabled {
  15. msanwrite(unsafe.Pointer(&to[0]), uintptr(n))
  16. }
  17. memmove(unsafe.Pointer(&to[0]), stringStructOf(&fm).str, uintptr(n))
  18. return n
  19. }

再举个例子,比如:

  1. func main() {
  2. slice := make([]byte, 3)
  3. n := copy(slice, "abcdef")
  4. fmt.Println(n,slice)
  5. }

输出:

  1. 3 [97,98,99]

说到拷贝,切片中有一个需要注意的问题。

  1. func main() {
  2. slice := []int{10, 20, 30, 40}
  3. for index, value := range slice {
  4. fmt.Printf("value = %d , value-addr = %x , slice-addr = %x\n", value, &value, &slice[index])
  5. }
  6. }

输出:

  1. value = 10 , value-addr = c4200aedf8 , slice-addr = c4200b0320
  2. value = 20 , value-addr = c4200aedf8 , slice-addr = c4200b0328
  3. value = 30 , value-addr = c4200aedf8 , slice-addr = c4200b0330
  4. value = 40 , value-addr = c4200aedf8 , slice-addr = c4200b0338

从上面结果我们可以看到,如果用 range 的方式去遍历一个切片,拿到的 Value 其实是切片里面的值拷贝。所以每次打印 Value 的地址都不变。

深入解析 Go 中 Slice 底层实现 - 图12

由于 Value 是值拷贝的,并非引用传递,所以直接改 Value 是达不到更改原切片值的目的的,需要通过 &slice[index] 获取真实的地址。


Reference:
《Go in action》
《Go 语言学习笔记》

GitHub Repo:Halfrost-Field

Follow: halfrost · GitHub

Source: https://halfrost.com/go_slice/

深入解析 Go 中 Slice 底层实现 - 图13
https://halfrost.com/go_slice/