简单介绍 Map 类型的安全使用
写在前面
过去 Web 开发的工作比较少涉及到并发的问题,每个用户请求在独立的线程里面进行,偶尔涉及到异步任务但是线程间数据同步模型非常简单,因此并未深入探究过并发这一块。最近在写游戏相关的服务端代码时发现数据的并发同步场景非常多,因此花了一点时间来探索。这是一个系列文章,本文为第三篇。
本文简单介绍 Golang 中 map 类型的安全使用。
Golang 中 map 的使用
在业务逻辑中保存 key-value
是一个非常普遍的需求,因此 Map
的使用场景非常多。
不允许并发读写的 map
在 Golang 源码实现中对 map 的要求比较高(见《 Go maps in action》):Maps are not safe for concurrent use: it's not defined what happens when you read and write to them simultaneously
(当并发使用时 Maps 是不安全的,当并发地读写 map 的时候无法预知会发生啥 )。
如果不加保护地在不同的线程中读写 map
类型的数据,代码会直接崩溃并异常退出。比如下面的代码:
package main
func main() {
m := make(map[int]int)
go func() {
for {
_ = m[1]
}
}()
go func() {
for {
m[2] = 1
}
}()
select {}
}
运行上面的代码可以得到下面类似的结果:
go run map/main.go
# fatal error: concurrent map read and map write
# ....(省略异常堆栈)
从输出结果来看,Golang 运行时明确禁止 map
的并发读写,且在检测到这种情况后直接异常退出。这不同于其他数据类型,比如 int
、string
等,对比下面的代码(说明:下面的代码存在隐形的并发问题,具体参考《浅谈 Golang 中数据的并发同步问题(二)》):
// 运行下面的代码并不会异常退出,不同于上面 map 类型的 m 的使用
// go run main.go
package main
func main() {
var m int
go func() {
for {
_ = m
}
}()
go func() {
for {
m = 1
}
}()
select {}
}
再次需要说明,虽然上面的代码在不同的线程中访问 int
类型的数据并未直接异常退出,但是这种不加任何安全措施的并发读写是存在安全风险的,具体参考《浅谈 Golang 中数据的并发同步问题(二)》。
安全使用 map——显而易见地加锁
既然 Golang 在运行时不允许对 map 的并发读写,当需要在多个线程中读写 map 时,显而易见的方式是加锁(如《浅谈 Golang 中数据的并发同步问题(一)》所描述的)。
下面的代码把 map
类型的 m
封装在一个匿名的 struct
中,同时整个匿名的 struct
继承了 sync.RWMutex
结构,因此拥有了 加读写锁 的功能,从而安全地实现了多个线程对 map
的 “并发读写”:
package main
import (
"sync"
)
func main() {
var counter = struct {
sync.RWMutex
m map[string]int
}{m: make(map[string]int)}
go func() {
for {
counter.RLock()
_ = counter.m["some_key"]
counter.RUnlock()
}
}()
go func() {
for {
counter.Lock()
counter.m["some_key"]++
counter.Unlock()
}
}()
select {}
}
为什么 map 并发读写时会在运行时异常退出
最后提一下这个问题:为什么 int、string、slice 等变量在多个线程读写时运行正常,而 map 在多个线程并发读写时会运行时异常退出? 其实这个涉及到 map
的具体实现(我知道这是一句废话 +_+)。
简单来讲,可以从Go 源码中 map 运行时相关的部分 窥见一些依据:map
的增改删查可以分别对应到 func mapassign()
、func mapaccess1()
、func mapdelete()
这几个函数,每个函数都有非常长的执行逻辑;如果多个线程并发读写同一个 map
,大概率会出现 ① mapassign
函数(增加某个 key
的值)执行到一半的时候 mapaccess1
读取到一个相应的零值,② mapaccess1
函数(读取某个 key
的值)执行到一半的时候 mapdelete
已经删除了对应的 key
,等等。
同时考虑到增删数据时底层数据的改变(比如扩容重分配,这一块还没深入研究,可以自行查看源码=。=),因此保持 map 的单纯变得很重要;为避免出现难以 debug 的异常,运行时环境显式地并发异常退出也就可以理解了。
小结
Golang 的运行时会在 map 的增改删查过程中检测是否有并发读写的情况,当发现并发读写时直接异常退出。相对于其他数据类型(比如 int、string、slice 等),map 的并发使用是比较严苛的(安全&性能的折中);可以认为 map 的这种严苛很大程度上降低了诡异 bug 的产生,增加代码的鲁棒性。
最后,当提到 map 的并发使用时,很多时候会提到 sync.Map
的使用,不过由于它大量使用了 interface{}
类型,使用起来并不是那么方便;目前为止,我更喜欢加读写锁的方式来使用 map 而不是使用线程安全的 sync.Map
😆
参考
- 浅谈 Golang 中数据的并发同步问题(一) 介绍通过加锁的方式保证线程安全
- 浅谈 Golang 中数据的并发同步问题(二) 介绍了 atomic 包的使用及其局限性
- Go maps in action - The Go Blog 官方文档中介绍 map 的博客(需要自备梯子)
- go语言坑之并发访问map 浅显易懂地介绍了 map 的坑及并发访问方法
- 疫苗:Java HashMap的死循环 了解 Java 中 HashMap 的实现机制,可以知道 Map 的线程不安全的实现是一个普遍现象
- src/runtime/map.go Go 源码中 map 相关的部分(运行时)
- sync - The Go Programming Language Golang 官方 sync 包中包含线程安全的
sync.Map
- go map的线程安全使用 介绍了
sync.Map
的使用