go并发 - map使用和并发安全详解 - 《Golang》

普通map
并发安全 sync.Map
- 普通map不安全原因
- 解决方案
sync.Map包
- sync.Map的底层结构
- 总结
  - 优点
  - 缺点
参考

普通map

Go语言中的 map 在并发情况下，只读是线程安全的，同时读写是线程不安全的。

map定义

map是一种无序的集合，对应的key （索引）会对应一个value（值），所以这个结构也称为关联数组或字典。

map在其他语言中hash、hash table等

var mapName map[key]value

mapName 为 map 的变量名。
key 为键类型。
value 是键对应的值类型。
map的使用和概念
```go package main

import “fmt”

func main() { maplist := make(map[string]int)//初始化内存了，想赋值就赋值 maplist[“three”] = 3 fmt.Println(maplist) }

**map必须先初始化内存，后使用，也就是需要make一下，或者直接赋值一个空map**
<a name="rcaiM"></a>
### map的容量
和数组不同的是，map可以根据新增的key-value动态的伸缩，因此不存在固定长度或者最大限制，但是也可以选择初始化容量的值
```go
maplist := make(map[string]float, 100)

出于性能考虑，对于大的map或者快速扩张的map，最好先标明
用切片作为map的值

maplist1 := make(map[int][]int)
maplist2 := make(map[int]*[]int)

golang里的类型使用灵活，也可以任意组合，map里的值可以是struct，也可以是int、string、甚至是切片、数组。

map的使用

map的遍历

scene := make(map[string]int)
scene["route"] = 66
scene["brazil"] = 4
scene["china"] = 960
for k, v := range scene {
    fmt.Println(k, v)
}

map的删除和断言

package main
import "fmt"
func main() {
    maplist := make(map[string]int)
    // 准备map数据
    maplist["LYY"] = 66
    maplist["520"] = 4
    maplist["666"] = 960
    delete(maplist, "666")
    for k, v := range maplist {
        fmt.Println(k, v)
    }
}

map的坑

package main
import "fmt"
func main() {
    m := map[int]struct{}{
        1: {},
        2: {},
        3: {},
        4: {},
        5: {},
    }
    for k := range m {
        fmt.Println(k)
    }
}
//没有设置v值的时候，map的遍历是随机的，起始遍历是个随机值

并发安全 sync.Map

普通map不安全原因

官网解释：同一个变量在多个goroutine中访问需要保证其安全性。

package main
import (
    "fmt"
    "time"
)
var TestMap map[string]string
func init() {
    TestMap = make(map[string]string, 1)
}
func main() {
    for i := 0; i < 1000; i++ {
        go Write("aaa")
        go Read("aaa")
        go Write("bbb")
        go Read("bbb")
    }
    time.Sleep(5 * time.Second)
}
func Read(key string) {
    fmt.Println(TestMap[key])
}
func Write(key string) {
    TestMap[key] = key
}
//报错 fatal error: concurrent map writes

原因：因为map变量为指针类型变量，并发写时，多个协程同时操作一个内存，类似于多线程操作同一个资源会发生竞争关系，共享资源会遭到破坏，因此golang 出于安全的考虑，抛出致命错误：fatal error: concurrent map writes。

解决方案

在读写操作的时候增加锁，删除时候除了加锁外，还需要增加断言避免出现错误

package main
import (
    "fmt"
    "sync"
    "time"
)
var TestMap map[string]string
func init() {
    TestMap = make(map[string]string, 1)
}
var lock sync.Mutex
func main() {
    for i := 0; i < 1000; i++ {
        go Write("aaa")
        go Read("aaa")
        go Write("bbb")
        go Read("bbb")
    }
    time.Sleep(3 * time.Second)
}
func Read(key string) {
    lock.Lock()
    defer lock.Unlock()
    fmt.Println(TestMap[key])
}
func Write(key string) {
    lock.Lock()
    TestMap[key] = key
    lock.Unlock()
}

...
aaa
bbb
aaa
bbb
aaa
bbb
aaa
bbb
aaa
bbb
进程 已完成，退出代码为 0

sync.Map包

Go语言普通map不是线程安全的，无法应用于Go语言的高并发场景。
Go语言原生实现了一种线程安全的sync.Map，可以实现并发的读写，并且性能比map+锁的机制的性能要高许多。

package main
import (
    "fmt"
    "sync"
)
func main() {
    m := sync.Map{}
    m.Store("a", 11)
    m.Store("b", 22)
    m.Store("c", 33)
    m.Store("d", 44)
    //读取数据
    fmt.Println(m.Load("a")) // 11 true
    m.Range(func(key, value any) bool {
        fmt.Println(key, value)
        return true
    })
    /**
    a 11
    b 22
    c 33
    d 44
    */
}

sync.Map的底层结构

type Map struct {
    mu Mutex
    // 基本上你可以把它看成一个安全的只读的map
    // 它包含的元素其实也是通过原子操作更新的，但是已删除的entry就需要加锁操作了
    read atomic.Value // readOnly
    // 包含需要加锁才能访问的元素
    // 包括所有在read字段中但未被expunged（删除）的元素以及新加的元素
    dirty map[interface{}]*entry
    // 记录从read中读取miss的次数，一旦miss数和dirty长度一样了，就会把dirty提升为read，并把dirty置空
    misses int
}
type readOnly struct {
    m       map[interface{}]*entry
    amended bool // 当dirty中包含read没有的数据时为true，比如新增一条数据
}
// expunged是用来标识此项已经删掉的指针
// 当map中的一个项目被删除了，只是把它的值标记为expunged，以后才有机会真正删除此项
var expunged = unsafe.Pointer(new(interface{}))
// entry代表一个值
type entry struct {
    p unsafe.Pointer // *interface{}
}

Map 的定义中，read 字段通过 atomic.Values 存储被高频读的 readOnly 类型的数据。dirty 存储

总结

sync.Map底层使用了两个map分离了map的扩容问题，分别是read map 和dirty map，read map主要用于对key的查找和修改，不会引发扩容的操作，dirty map主要用于新增数据，可能会引发扩容，这时候需要加锁。

优点

使用两个map将进行读写和追加分离，线程安全的，在读多追加少的场景具有较高的性能。

缺点

不适用于大量追加的场景，在追加的时候在read map中查找不到数据的时候，会进行加锁对dirty map进行操作，并进行提升和重构。但是，在 dirty map 刚被提升后，将 read map 复制到新的 dirty map中，在存在大量的数据的情况下复制操作会阻塞所有的协程极大的影响性能。

map使用和并发安全详解