|
1 | | -# 散列表 |
2 | | - |
3 | | -散列表是数组的一种扩展,利用数组下标的随机访问特性。 |
4 | | - |
5 | | -## 散列思想 |
6 | | - |
7 | | -* 键/关键字/Key:用来标识一个数据 |
8 | | -* 散列函数/哈希函数/Hash:将 Key 映射到数组下标的函数 |
9 | | -* 散列值/哈希值:Key 经过散列函数得到的数值 |
10 | | - |
11 | | - |
12 | | - |
13 | | -本质:利用散列函数将关键字映射到数组下标,而后利用数组随机访问时间复杂度为 $\Theta(1)$ 的特性快速访问。 |
14 | | - |
15 | | -## 散列函数 |
16 | | - |
17 | | -* 形式:`hash(key)` |
18 | | -* 基本要求 |
19 | | - 1. 散列值是非负整数 |
20 | | - 1. 如果 `key1 == key2`,那么 `hash(key1) == hash(key2)` |
21 | | - 1. 如果 `key1 != key2`,那么 `hash(key1) != hash(key2)` |
22 | | - |
23 | | -第 3 个要求,实际上不可能对任意的 `key1` 和 `key2` 都成立。因为通常散列函数的输出范围有限而输入范围无限。 |
24 | | - |
25 | | -## 散列冲突¡ |
26 | | - |
27 | | -* 散列冲突:`key1 != key2` 但 `hash(key1) == hash(key2)` |
28 | | - |
29 | | -散列冲突会导致不同键值映射到散列表的同一个位置。为此,我们需要解决散列冲突带来的问题。 |
30 | | - |
31 | | -### 开放寻址法 |
32 | | - |
33 | | -如果遇到冲突,那就继续寻找下一个空闲的槽位。 |
34 | | - |
35 | | -#### 线性探测 |
36 | | - |
37 | | -插入时,如果遇到冲突,那就依次往下寻找下一个空闲的槽位。(橙色表示已被占用的槽位,黄色表示空闲槽位) |
38 | | - |
39 | | - |
40 | | - |
41 | | -查找时,如果目标槽位上不是目标数据,则依次往下寻找;直至遇见目标数据或空槽位。 |
42 | | - |
43 | | - |
44 | | - |
45 | | -删除时,标记为 `deleted`,而不是直接删除。 |
46 | | - |
47 | | -#### 平方探测(Quadratic probing) |
48 | | - |
49 | | -插入时,如果遇到冲突,那就往后寻找下一个空闲的槽位,其步长为 $1^2$, $2^2$, $3^2$, $\ldots$。 |
50 | | - |
51 | | -查找时,如果目标槽位上不是目标数据,则依次往下寻找,其步长为 $1^2$, $2^2$, $3^2$, $\ldots$;直至遇见目标数据或空槽位。 |
52 | | - |
53 | | -删除时,标记为 `deleted`,而不是直接删除。 |
54 | | - |
55 | | -#### 装载因子(load factor) |
56 | | - |
57 | | -$\text{load factor} = \frac{size()}{capacity()}$ |
58 | | - |
59 | | -### 链表法 |
60 | | - |
61 | | -所有散列值相同的 key 以链表的形式存储在同一个槽位中。 |
62 | | - |
63 | | - |
64 | | - |
65 | | -插入时,不论是否有冲突,直接插入目标位置的链表。 |
66 | | - |
67 | | -查找时,遍历目标位置的链表来查询。 |
68 | | - |
69 | | -删除时,遍历目标位置的链表来删除。 |
| 1 | +# 散列表 |
| 2 | + |
| 3 | +散列表是数组的一种扩展,利用数组下标的随机访问特性。 |
| 4 | + |
| 5 | +## 散列思想 |
| 6 | + |
| 7 | +* 键/关键字/Key:用来标识一个数据 |
| 8 | +* 散列函数/哈希函数/Hash:将 Key 映射到数组下标的函数 |
| 9 | +* 散列值/哈希值:Key 经过散列函数得到的数值 |
| 10 | + |
| 11 | + |
| 12 | + |
| 13 | +本质:利用散列函数将关键字映射到数组下标,而后利用数组随机访问时间复杂度为 $\Theta(1)$ 的特性快速访问。 |
| 14 | + |
| 15 | +## 散列函数 |
| 16 | + |
| 17 | +* 形式:`hash(key)` |
| 18 | +* 基本要求 |
| 19 | + 1. 散列值是非负整数 |
| 20 | + 1. 如果 `key1 == key2`,那么 `hash(key1) == hash(key2)` |
| 21 | + 1. 如果 `key1 != key2`,那么 `hash(key1) != hash(key2)` |
| 22 | + |
| 23 | +第 3 个要求,实际上不可能对任意的 `key1` 和 `key2` 都成立。因为通常散列函数的输出范围有限而输入范围无限。 |
| 24 | + |
| 25 | +## 散列冲突 |
| 26 | + |
| 27 | +* 散列冲突:`key1 != key2` 但 `hash(key1) == hash(key2)` |
| 28 | + |
| 29 | +散列冲突会导致不同键值映射到散列表的同一个位置。为此,我们需要解决散列冲突带来的问题。 |
| 30 | + |
| 31 | +### 开放寻址法 |
| 32 | + |
| 33 | +如果遇到冲突,那就继续寻找下一个空闲的槽位。 |
| 34 | + |
| 35 | +#### 线性探测 |
| 36 | + |
| 37 | +插入时,如果遇到冲突,那就依次往下寻找下一个空闲的槽位。(橙色表示已被占用的槽位,黄色表示空闲槽位) |
| 38 | + |
| 39 | + |
| 40 | + |
| 41 | +查找时,如果目标槽位上不是目标数据,则依次往下寻找;直至遇见目标数据或空槽位。 |
| 42 | + |
| 43 | + |
| 44 | + |
| 45 | +删除时,标记为 `deleted`,而不是直接删除。 |
| 46 | + |
| 47 | +#### 平方探测(Quadratic probing) |
| 48 | + |
| 49 | +插入时,如果遇到冲突,那就往后寻找下一个空闲的槽位,其步长为 $1^2$, $2^2$, $3^2$, $\ldots$。 |
| 50 | + |
| 51 | +查找时,如果目标槽位上不是目标数据,则依次往下寻找,其步长为 $1^2$, $2^2$, $3^2$, $\ldots$;直至遇见目标数据或空槽位。 |
| 52 | + |
| 53 | +删除时,标记为 `deleted`,而不是直接删除。 |
| 54 | + |
| 55 | +#### 装载因子(load factor) |
| 56 | + |
| 57 | +$\text{load factor} = \frac{size()}{capacity()}$ |
| 58 | + |
| 59 | +### 链表法 |
| 60 | + |
| 61 | +所有散列值相同的 key 以链表的形式存储在同一个槽位中。 |
| 62 | + |
| 63 | + |
| 64 | + |
| 65 | +插入时,不论是否有冲突,直接插入目标位置的链表。 |
| 66 | + |
| 67 | +查找时,遍历目标位置的链表来查询。 |
| 68 | + |
| 69 | +删除时,遍历目标位置的链表来删除。 |
0 commit comments