map 概念
在Go语言中,map
是一种内建的数据结构,它提供了一种关联式的存储机制,允许你以键值对的形式存储数据。每个键都是唯一的,并且与一个值相关联。你可以通过键来查找、添加、更新和删除值,这类似于其他编程语言中的"字典"或"关联数组"。
Go语言中的 map
具备以下特性:
-
无序性 :
map
中的键值对存储顺序并不固定,每次迭代可能会得到不同的顺序(虽然从Go 1.8开始,内部实现努力保证迭代顺序的一致性,但这并不是语言规范所保证的)。 -
动态大小 :
map
的容量会在需要时自动增长,不需要预先指定大小。 -
键值对:键和值可以是任何类型的,但键必须是可比较的,也就是说,它不能是诸如slice、map或函数这样的不可比较类型。通常情况下,整型、浮点型、字符串、指针和结构体(其中所有字段也是可比较的)都可以作为键。
-
初始化 :
map
是引用类型,所以在使用前必须初始化。可以通过make
函数来创建一个新的空map
,例如m := make(map[keyType]valueType)
。另外,从Go 1.11开始,也可以使用类型推断来初始化map
,例如m := map[string]int{}
。 -
操作:
- 插入 :
m[key] = value
,如果键已经存在,则更新其值;否则插入新的键值对。 - 查找 :
value := m[key]
,若键存在则获取其值,否则返回该类型的零值。 - 删除 :
delete(m, key)
,用于删除给定键对应的键值对。 - 判断键是否存在 :
value, ok := m[key]
,这里的ok
是一个布尔值,如果键存在于map
中,则ok
为true
,并且返回对应的值;否则ok
为false
,返回值为该类型的零值。
- 插入 :
-
迭代 :可以使用
for key, value := range m {...}
循环来遍历map
中的所有键值对。
Go语言的 map
实现上通常采用哈希表(Hash Table),因此对于大多数操作具有接近O(1)的平均时间复杂度。需要注意的是,由于并发访问可能导致数据不一致,所以在多线程环境下,如果不采取适当的同步措施,直接操作 map
可能会引发数据竞争,这时应使用 sync.Map
或使用互斥锁来保护 map
的访问。
示例:
Go
//var mapname map[keytype]valuetype
/*其中:
mapname 为 map 的变量名。
keytype 为键类型。
valuetype 是键对应的值类型。
*/
var map1 map[string]int
map2 := map[string]int{}
map3 := map[string]int{"one": 1, "two": 2}
map4 := make(map[string]float32)
map1 = map[string]int{"one": 1, "two": 2}
map2["key1"] = 6
map3["one"] = 2
map4["key1"] = 3.1415926
map5 := map4
map5["tow"] = 5 //map是引用类型,此时map4的tow的值也变成5
fmt.Println("map1:", map1) //map1: map[one:1 two:2]
fmt.Println("map2:", map2) //map2: map[key1:6]
fmt.Println("map3:", map3) //map3: map[one:2 two:2]
fmt.Println("map4:", map4) //map4: map[key1:3.1415925 tow:5]
fmt.Println("map5:", map5) //map5: map[key1:3.1415925 tow:5]
注意:如果在声明一个map并赋值,采用的是如下的方式运行的时候会报错:
Go
var map1 map[string]int
map1["key1"] = 5
原因是:当你声明一个map变量但未初始化它时(就像 var map1 map[string]int
这样),它的值是 nil
,而不是一个空的map。尝试向一个 nil
map中添加键值对会导致 panic。
map 容量
和数组不同,map 可以根据新增的 key-value 动态的伸缩,因此它不存在固定长度或者最大限制,但是也可以选择标明 map 的初始容量 capacity,格式如下:
make(map[keytype]valuetype, cap)
例如:
map2 := make(map[string]float, 100)
当 map 增长到容量上限的时候,如果再增加新的 key-value,map 的大小会自动加 1,所以出于性能的考虑,对于大的 map 或者会快速扩张的 map,即使只是大概知道容量,也最好先标明。
用切片作为 map 的值
既然一个 key 只能对应一个 value,而 value 又是一个原始类型,那么如果一个 key 要对应多个值怎么办?例如,当我们要处理 unix 机器上的所有进程,以父进程(pid 为整形)作为 key,所有的子进程(以所有子进程的 pid 组成的切片)作为 value。通过将 value 定义为 []int 类型或者其他类型的切片,就可以优雅的解决这个问题,示例代码如下所示:
Go
mp1 := make(map[int][]int)
slice1 := []int{1, 2, 3}
mp1[0] = slice1
mp2 := make(map[int]*[]int)
slice2 := []int{4, 5, 6}
mp2[1] = &slice2
// 现在你可以通过键来访问相应的切片
fmt.Println(mp1[0]) // 输出: [1 2 3]
fmt.Println(*mp2[1]) // 输出: [4 5 6]
遍历map
Go
instances := map[string]int{"key1": 1, "key2": 2, "key3": 3}
for k, v := range instances {
fmt.Println(k, v)
}
//运行结果
//key3 3
//key1 1
//key2 2
//如果只遍历值,可以使用如下方式
for _, v := range instances {
fmt.Println(v)
}
//运行结果
//1
//2
//3
//如果只遍历键,可以使用如下方式
for k := range instances {
fmt.Println(k)
}
//运行结果
//key2
//key3
//key1
注意:遍历输出元素的顺序与填充顺序无关,不能期望 map 在遍历时返回某种期望顺序的结果。
如果需要特定顺序的遍历结果,正确的做法是先排序,代码如下:
Go
scene := make(map[string]int)
// 准备map数据
scene["route"] = 66
scene["brazil"] = 4
scene["china"] = 960
// 声明一个切片保存map数据
var sceneList []string
// 将map数据遍历复制到切片中
for k := range scene {
sceneList = append(sceneList, k)
}
// 对切片进行排序
sort.Strings(sceneList)
// 输出
fmt.Println(sceneList) // //[brazil china route]
//按值排序
for _, v := range scene {
sceneList = append(sceneList, v)
}
// 对切片进行排序
sort.Ints(sceneList)
// 输出
fmt.Println(sceneList) //[4 66 960]
删除map元素
使用 delete() 内建函数从 map 中删除一组键值对,delete() 函数的格式如下:
delete(map, 键)
其中 map 为要删除的 map 实例,键为要删除的 map 中键值对的键。
从 map 中删除一组键值对可以通过下面的代码来完成:
Go
map1 := make(map[string]int)
// 准备map数据
map1["key1"] = 66
map1["key2"] = 4
map1["key3"] = 960
delete(map1, "key1")
for k, v := range map1 {
fmt.Println(k, v)
}
//key2 4
//key3 960
清空map所有元素
要清空一个Go语言中的map中的所有元素,无需逐个删除键值对,可以直接使用 make
函数重新分配一个相同类型的空映射,原映射占用的内存空间会由垃圾回收器自动回收。以下是清空映射的简单方法:
Go
originalMap := map[string]int{
"apple": 1,
"banana": 2,
// 更多键值对...
}
// 清空映射
originalMap = make(map[string]int)
fmt.Println(originalMap) // 输出:map[]
sync.map
sync.Map
是 Go 语言标准库 sync
包中提供的一个并发安全的映射(map)类型,特别适合在多个 Goroutine 并发读写数据的场景中使用。普通的 Go 语言 map
不支持并发安全的读写操作,如果在多线程环境中不加以同步控制,可能会导致数据竞争和不可预测的行为。
为什么要用 sync.Map:
- 并发安全 :在高并发场景下,多个 Goroutine 同时读写 map 时,
sync.Map
能够确保读写操作的线程安全性,避免因并发操作导致的数据不一致问题。 - 性能优化 :
sync.Map
内部采用读写分离的设计,利用两个底层的 map 结构 (read
和dirty
) 来达到更高的并发性能。对于只读操作,sync.Map
优先从只读 map 中获取数据,只有在写操作时才会加锁,从而降低了锁竞争的概率,提高了并发性能。
下面来看下并发情况下读写 map 时会出现的问题,代码如下:
Go
// 创建一个int到int的映射
m := make(map[int]int)
// 开启一段并发代码
go func() {
// 不停地对map进行写入
for {
m[1] = 1
}
}()
// 开启一段并发代码
go func() {
// 不停地对map进行读取
for {
_ = m[1]
}
}()
// 无限循环, 让并发程序在后台执行
for {
}
运行代码会报错,输出如下:
fatal error: concurrent map read and map write
错误信息显示,并发的 map 读和 map 写,也就是说使用了两个并发函数不断地对 map 进行读和写而发生了竞态问题,map 内部会对这种并发操作进行检查并提前发现。
需要并发读写时,一般的做法是加锁,但这样性能并不高,Go语言在 1.9 版本中提供了一种效率较高的并发安全的 sync.Map,sync.Map 和 map 不同,不是以语言原生形态提供,而是在 sync 包下的特殊结构。
sync.Map 有以下特性:
- 无须初始化,直接声明即可。
- sync.Map 不能使用 map 的方式进行取值和设置等操作,而是使用 sync.Map 的方法进行调用,Store 表示存储,Load 表示获取,Delete 表示删除。
- 使用 Range 配合一个回调函数进行遍历操作,通过回调函数返回内部遍历出来的值,Range 参数中回调函数的返回值在需要继续迭代遍历时,返回 true,终止迭代遍历时,返回 false。
如何使用 sync.Map:
Go
import (
"fmt"
"sync"
)
func main() {
// 创建一个 sync.Map
m := new(sync.Map)
// 存储键值对
m.Store("key1", "value1")
m.Store("key2", "value2")
// 读取值,value, ok 是两个返回值,ok 表示键是否存在
value, ok := m.Load("key1")
if ok {
fmt.Println("Found value:", value.(string)) // 类型断言为 string 类型
}
// 删除键值对
m.Delete("key1")
// 遍历 sync.Map
m.Range(func(key, value interface{}) bool {
fmt.Println("Key:", key, "Value:", value)
return true // 返回 true 继续遍历,返回 false 停止遍历
})
}
参考文章:
Go语言map(Go语言映射) (biancheng.net)