Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Commit 4946d4b

Browse files
author
lucifer
committed
feat: 并查集
1 parent 893667d commit 4946d4b

File tree

4 files changed

+299
-2
lines changed

4 files changed

+299
-2
lines changed

README.md

Lines changed: 3 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -302,13 +302,14 @@ leetcode 题解,记录自己的 leetcode 解题之路。
302302
- [前缀树专题](./thinkings/trie.md)
303303
- [《日程安排》专题](https://lucifer.ren/blog/2020/02/03/leetcode-%E6%88%91%E7%9A%84%E6%97%A5%E7%A8%8B%E5%AE%89%E6%8E%92%E8%A1%A8%E7%B3%BB%E5%88%97/)
304304
- [《构造二叉树》专题](https://lucifer.ren/blog/2020/02/08/%E6%9E%84%E9%80%A0%E4%BA%8C%E5%8F%89%E6%A0%91%E4%B8%93%E9%A2%98/)
305-
- [《贪婪策略》专题](./thinkings/greedy.md) 🆕
306-
- [《深度优先遍历》专题](./thinkings/DFS.md) 🆕
305+
- [《贪婪策略》专题](./thinkings/greedy.md)
306+
- [《深度优先遍历》专题](./thinkings/DFS.md)
307307
- [滑动窗口(思路 + 模板)](./thinkings/slide-window.md) 🆕
308308
- [位运算](./thinkings/bit.md) 🆕
309309
- [设计题](./thinkings/design.md) 🆕
310310
- [小岛问题](./thinkings/island.md) 🆕
311311
- [最大公约数](./thinkings/GCD.md) 🆕
312+
- [并查集](./thinkings/union-find.md) 🆕
312313

313314
### anki 卡片
314315

problems/547.friend-circles.md

Lines changed: 86 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,86 @@
1+
## 题目地址(547. 朋友圈)
2+
3+
https://leetcode-cn.com/problems/friend-circles/
4+
5+
## 题目描述
6+
7+
班上有  N  名学生。其中有些人是朋友,有些则不是。他们的友谊具有是传递性。如果已知 A 是 B  的朋友,B 是 C  的朋友,那么我们可以认为 A 也是 C  的朋友。所谓的朋友圈,是指所有朋友的集合。
8+
9+
给定一个  N \* N  的矩阵  M,表示班级中学生之间的朋友关系。如果 M[i][j] = 1,表示已知第 i 个和 j 个学生互为朋友关系,否则为不知道。你必须输出所有学生中的已知的朋友圈总数。
10+
11+
示例 1:
12+
13+
输入:
14+
[[1,1,0],
15+
[1,1,0],
16+
[0,0,1]]
17+
输出: 2
18+
说明:已知学生 0 和学生 1 互为朋友,他们在一个朋友圈。
19+
第 2 个学生自己在一个朋友圈。所以返回 2。
20+
示例 2:
21+
22+
输入:
23+
[[1,1,0],
24+
[1,1,1],
25+
[0,1,1]]
26+
输出: 1
27+
说明:已知学生 0 和学生 1 互为朋友,学生 1 和学生 2 互为朋友,所以学生 0 和学生 2 也是朋友,所以他们三个在一个朋友圈,返回 1。
28+
注意:
29+
30+
N 在[1,200]的范围内。
31+
对于所有学生,有 M[i][i] = 1。
32+
如果有 M[i][j] = 1,则有 M[j][i] = 1。
33+
34+
## 思路
35+
36+
并查集有一个功能是可以轻松计算出连通分量,然而本题的朋友圈的个数,本质上就是连通分量的个数,因此用并查集可以完美解决。
37+
38+
为了简单更加清晰,我将并查集模板代码单尽量独拿出来。
39+
40+
## 代码
41+
42+
`find`, `union`, `connected` 都是典型的模板方法。 懂的同学可能也发现了,我没有做路径压缩,这直接导致 find union connected 的时间复杂度最差的情况退化到 $O(N)$。
43+
44+
当然优化也不难,我们只需要给每一个顶层元素设置一个 size 用来表示连通分量的大小,这样 union 的时候我们将小的拼接到大的上即可。 另外 find 的时候我们甚至可以路径压缩,将树高限定到常数,这样时间复杂度可以降低到 $O(1)$。
45+
46+
```python
47+
class UF:
48+
parent = {}
49+
cnt = 0
50+
def __init__(self, M):
51+
n = len(M)
52+
for i in range(n):
53+
self.parent[i] = i
54+
self.cnt += 1
55+
56+
def find(self, x):
57+
while x != self.parent[x]:
58+
x = self.parent[x]
59+
return x
60+
def union(self, p, q):
61+
if self.connected(p, q): return
62+
self.parent[self.find(p)] = self.find(q)
63+
self.cnt -= 1
64+
def connected(self, p, q):
65+
return self.find(p) == self.find(q)
66+
67+
class Solution:
68+
def findCircleNum(self, M: List[List[int]]) -> int:
69+
n = len(M)
70+
uf = UF(M)
71+
for i in range(n):
72+
for j in range(i):
73+
if M[i][j] == 1:
74+
uf.union(i, j)
75+
return uf.cnt
76+
77+
```
78+
79+
**复杂度分析**
80+
81+
- 时间复杂度:平均 $O(logN)$,最坏的情况是 $O(N)$
82+
- 空间复杂度:我们使用了 parent, 因此空间复杂度为 $O(N)$
83+
84+
欢迎关注我的公众号《脑洞前端》获取更多更新鲜的 LeetCode 题解
85+
86+
![](https://pic.leetcode-cn.com/89ef69abbf02a2957838499a96ce3fbb26830aae52e3ab90392e328c2670cddc-file_1581478989502)

problems/721.accounts-merge.md

Lines changed: 78 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,78 @@
1+
## 题目地址(721. 账户合并)
2+
3+
https://leetcode-cn.com/problems/accounts-merge/
4+
5+
## 题目描述
6+
7+
给定一个列表 accounts,每个元素 accounts[i]  是一个字符串列表,其中第一个元素 accounts[i][0]  是   名称 (name),其余元素是 emails 表示该帐户的邮箱地址。
8+
9+
现在,我们想合并这些帐户。如果两个帐户都有一些共同的邮件地址,则两个帐户必定属于同一个人。请注意,即使两个帐户具有相同的名称,它们也可能属于不同的人,因为人们可能具有相同的名称。一个人最初可以拥有任意数量的帐户,但其所有帐户都具有相同的名称。
10+
11+
合并帐户后,按以下格式返回帐户:每个帐户的第一个元素是名称,其余元素是按顺序排列的邮箱地址。accounts 本身可以以任意顺序返回。
12+
13+
例子 1:
14+
15+
Input:
16+
accounts = [["John", "[email protected]", "[email protected]"], ["John", "[email protected]"], ["John", "[email protected]", "[email protected]"], ["Mary", "[email protected]"]]
17+
18+
Explanation:
19+
第一个和第三个 John 是同一个人,因为他们有共同的电子邮件 "[email protected]"。
20+
第二个 John 和 Mary 是不同的人,因为他们的电子邮件地址没有被其他帐户使用。
21+
我们可以以任何顺序返回这些列表,例如答案[['Mary','[email protected]']['John','[email protected]']
22+
['John','[email protected]','[email protected]','[email protected]']]仍然会被接受。
23+
24+
注意:
25+
26+
accounts 的长度将在[1,1000]的范围内。
27+
accounts[i]的长度将在[1,10]的范围内。
28+
accounts[i][j]的长度将在[1,30]的范围内。
29+
30+
## 思路
31+
32+
我们抛开 name 不管。 我们只根据 email 建立并查集即可。这样一个连通分量中的 email 就是一个人,我们在用一个 hashtable 记录 email 和 name 的映射,将其输出即可。
33+
34+
> 如果题目不要求我们输出 name,我们自然根本不需要 hashtable 做映射
35+
36+
## 代码
37+
38+
`find`, `union`, `connected` 都是典型的模板方法。 懂的同学可能也发现了,我没有做路径压缩,这直接导致 find union connected 的时间复杂度最差的情况退化到 $O(N)$。
39+
40+
当然优化也不难,我们只需要给每一个顶层元素设置一个 size 用来表示连通分量的大小,这样 union 的时候我们将小的拼接到大的上即可。 另外 find 的时候我们甚至可以路径压缩,将树高限定到常数,这样时间复杂度可以降低到 $O(1)$。
41+
42+
```python
43+
class UF:
44+
def __init__(self):
45+
self.parent = {}
46+
47+
def find(self, x):
48+
self.parent.setdefault(x, x)
49+
while x != self.parent[x]:
50+
x = self.parent[x]
51+
return x
52+
def union(self, p, q):
53+
self.parent[self.find(p)] = self.find(q)
54+
55+
56+
class Solution:
57+
def accountsMerge(self, accounts: List[List[str]]) -> List[List[str]]:
58+
uf = UF()
59+
email_to_name = {}
60+
res = collections.defaultdict(list)
61+
for account in accounts:
62+
for i in range(1, len(account)):
63+
email_to_name[account[i]] = account[0]
64+
if i < len(account) - 1:uf.union(account[i], account[i + 1])
65+
for email in email_to_name:
66+
res[uf.find(email)].append(email)
67+
68+
return [[email_to_name[value[0]]] + sorted(value) for value in res.values()]
69+
```
70+
71+
**复杂度分析**
72+
73+
- 时间复杂度:平均 $O(logN)$,最坏的情况是 $O(N)$
74+
- 空间复杂度:我们使用了 parent, 因此空间复杂度为 $O(N)$
75+
76+
欢迎关注我的公众号《脑洞前端》获取更多更新鲜的 LeetCode 题解
77+
78+
![](https://pic.leetcode-cn.com/89ef69abbf02a2957838499a96ce3fbb26830aae52e3ab90392e328c2670cddc-file_1581478989502)

thinkings/union-find.md

Lines changed: 132 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,132 @@
1+
# 并查集
2+
3+
关于并查集的题目不少,官方给的数据是 30 道(截止 2020-02-20),但是有一些题目虽然官方没有贴`并查集`标签,但是使用并查集来说确非常简单。这类题目如果掌握模板,那么刷这种题会非常快,并且犯错的概率会大大降低,这就是模板的好处。
4+
5+
我这里总结了几道并查集的题目:
6+
7+
- [547. 朋友圈](../problems/547.friend-circles.md)
8+
- [721. 账户合并](https://leetcode-cn.com/problems/accounts-merge/solution/mo-ban-ti-bing-cha-ji-python3-by-fe-lucifer-3/)
9+
- [990. 等式方程的可满足性](https://github.com/azl397985856/leetcode/issues/304)
10+
11+
看完这里的内容,建议拿上面的题目练下手,检测一下学习成果。
12+
13+
## 概述
14+
15+
并查集是一种树型的数据结构,用于处理一些不交集(Disjoint Sets)的合并及查询问题。有一个联合-查找算法(Union-find Algorithm)定义了两个用于此数据结构的操作:
16+
17+
- Find:确定元素属于哪一个子集。它可以被用来确定两个元素是否属于同一子集。
18+
- Union:将两个子集合并成同一个集合。
19+
20+
由于支持这两种操作,一个不相交集也常被称为联合-查找数据结构(Union-find Data Structure)或合并-查找集合(Merge-find Set)。为了更加精确的定义这些方法,需要定义如何表示集合。一种常用的策略是为每个集合选定一个固定的元素,称为代表,以表示整个集合。接着,Find(x) 返回 x 所属集合的代表,而 Union 使用两个集合的代表作为参数。
21+
22+
## 形象解释
23+
24+
比如有两个司令。 司令下有若干军长,军长下有若干师长。。。
25+
26+
我们如何判断某两个师长是否属于同一个司令呢(连通性)?
27+
28+
![](https://tva1.sinaimg.cn/large/007S8ZIlly1ge1ap6p77yj30gs0bz3zn.jpg)
29+
30+
很简单,我们顺着师长,往上找,找到司令。 如果两个师长找到的是同一个司令,那么就属于同一个司令。我们用 parent[x] = y 表示 x 的 parent 是 y,通过不断沿着搜索 parent 搜索找到 root,然后比较 root 是否相同即可得出结论。
31+
32+
以上过程涉及了两个基本操作`find``connnected`。 并查集除了这两个基本操作,还有一个是`union`。即将两个集合合并为同一个。
33+
34+
如图有两个司令:
35+
36+
![](https://tva1.sinaimg.cn/large/007S8ZIlly1ge1auw6z8oj30wp0eljth.jpg)
37+
38+
我们将其合并为一个联通域,最简单的方式就是直接将其中一个司令指向另外一个即可:
39+
40+
![](https://tva1.sinaimg.cn/large/007S8ZIlly1ge1awrmaclj30ym0cogo4.jpg)
41+
42+
以上就是三个核心 API `find``connnected``union`, 的形象化解释,下面我们来看下代码实现。
43+
44+
## 核心 API
45+
46+
### find
47+
48+
```python
49+
def find(self, x):
50+
while x != self.parent[x]:
51+
x = self.parent[x]
52+
return x
53+
```
54+
55+
### connected
56+
57+
```python
58+
def connected(self, p, q):
59+
return self.find(p) == self.find(q)
60+
```
61+
62+
### union
63+
64+
```python
65+
def union(self, p, q):
66+
if self.connected(p, q): return
67+
self.parent[self.find(p)] = self.find(q)
68+
```
69+
70+
## 完整代码模板
71+
72+
```python
73+
class UF:
74+
parent = {}
75+
def __init__(self, equations):
76+
# 做一些初始化操作
77+
78+
def find(self, x):
79+
while x != self.parent[x]:
80+
x = self.parent[x]
81+
return x
82+
def union(self, p, q):
83+
if self.connected(p, q): return
84+
self.parent[self.find(p)] = self.find(q)
85+
def connected(self, p, q):
86+
return self.find(p) == self.find(q)
87+
```
88+
89+
## 带路径压缩的代码模板
90+
91+
```python
92+
class UF:
93+
parent = {}
94+
def __init__(self, equations):
95+
# 做一些初始化操作
96+
def find(self, x):
97+
if x != self.parent[x]:
98+
parent[x] = find(parent[x])
99+
return parent[x]
100+
def union(self, p, q):
101+
if self.connected(p, q): return
102+
self.parent[self.find(p)] = self.find(q)
103+
def connected(self, p, q):
104+
return self.find(p) == self.find(q)
105+
```
106+
107+
上面是递归的方式进行路径压缩,写起来比较简单。但是有栈溢出的风险。 接下来我们看下迭代的写法:
108+
109+
```python
110+
class UF:
111+
parent = {}
112+
def __init__(self, equations):
113+
# 做一些初始化操作
114+
115+
def find(self, x):
116+
# 根节点
117+
r = x
118+
while r != parent[r]:
119+
r = parent[r]
120+
k = x
121+
while k != r:
122+
# 暂存parent[k]的父节点
123+
j = parent[k]
124+
parent[k] = r
125+
k = j
126+
return r
127+
def union(self, p, q):
128+
if self.connected(p, q): return
129+
self.parent[self.find(p)] = self.find(q)
130+
def connected(self, p, q):
131+
return self.find(p) == self.find(q)
132+
```

0 commit comments

Comments
 (0)