本文会介绍两道比较有技巧性的算法与数据结构题,都是和随机读取元素相关的。这些问题的技巧性子阿宇如何将哈希表和数组结合起来,使得数组的删除操作时间复杂度变成O(1)。
实现随机集合
设计一个支持在平均 时间复杂度 O(1) 下,执行以下操作的数据结构。
- insert(val):当元素 val 不存在时,向集合中插入该项。
- remove(val):元素 val 存在时,从集合中移除该项。
- getRandom:随机返回现有集合中的一项。每个元素应该有相同的概率被返回。
示例 :
1 | // 初始化一个空的集合。 |
本题的难点在于两点:
**1、插入,删除,获取随机元素这三个操作的时间复杂度必须都是 O(1)**。
2、**getRandom
** 方法返回的元素必须等概率返回随机元素,也就是说,如果集合里面有 n
个元素,每个元素被返回的概率必须是 1/n
。
我们先来分析一下:对于插入,删除,查找这几个操作,哪种数据结构的时间复杂度是 O(1)?
HashSet
肯定算一个对吧。哈希集合的底层原理就是一个大数组,我们把元素通过哈希函数映射到一个索引上;如果用拉链法解决哈希冲突,那么这个索引可能连着一个链表或者红黑树。
那么请问对于这样一个标准的 HashSet
,你能否在 O(1) 的时间内实现 getRandom
函数?
其实是不能的,因为根据刚才说到的底层实现,元素是被哈希函数「分散」到整个数组里面的,更别说还有拉链法等等解决哈希冲突的机制,基本做不到 O(1) 时间等概率随机获取元素。
根据上面的分析,对于 getRandom
方法,如果想「等概率」且「在 O(1) 的时间」取出元素,一定要满足:底层用数组实现,且数组必须是紧凑的。
这样我们就可以直接生成随机数作为索引,从数组中取出该随机索引对应的元素,作为随机元素。
但如果用数组存储元素的话,插入,删除的时间复杂度怎么可能是 O(1) 呢?
可以做到!对数组尾部进行插入和删除操作不会涉及数据搬移,时间复杂度是 O(1)。
所以,如果我们想在 O(1) 的时间删除数组中的某一个元素 **val
**,可以先把这个元素交换到数组的尾部,然后再 pop
掉。
交换两个元素必须通过索引进行交换对吧,那么我们需要一个哈希表 m
来记录每个元素值对应的索引。
1 | type RandomizedSet struct { |
- Post title:在O(1)时间内删除或查找任意元素
- Post author:洪笳淏
- Create time:2021-06-20 15:03:00
- Post link:https://jiahaohong1997.github.io/2021/06/20/在O(1)时间内删除或查找任意元素/
- Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.