并查集原理及联通分量个数问题
[TOC]
一、并查集
并查集是一个复杂的数据结构。在lc中大概有30道题左右(官方给出)
集合运算
常见的集合运算有:
交、并、补、差、判定一个元素是否属于某一集合
并查集: 集合并、查
某元素属于什么集合
存储实现
使用树结构
表示集合,树的每个结点代表一个集合元素
图示
如图所示有两个集合,如何判定A-I九个元素属于哪个集合?
例:E 和 C是否为同一个集合。
可以不停的向上查找元素的父节点。判断是否有同一个根节点:
E->B->A
C->A
可见 E和C是同一集合
实际刷题中往往会给一个关系矩阵
, 需要自己创建所有集合。
初始化每个元素为一个集合:
有九个集合,通过关系矩阵
在集合进行并操作:
例: 在关系矩阵中,A和B在同一集合。则将{A}和{B}并起来。即B指向A。
最终构造出由关系矩阵
得到的并查集
抽象数据
元素类型:
1 | class Node(object): |
优化
随着树的高度的增加,find方法进行查询的时候,随着大量的union操作调用,导致复杂度的线性上升。导致树结构变成一个类似于线性表的结构。这种变化叫做树的退化,并查集算法需要对此问题进行优化。
定义Rank
对于每棵树,记录树的高度Rank,当进行union操作,合并两棵树时,如果其Rank不同,那么由Rank小树的连向Rank大的树。
上图中左边的树Rank=3,右边的树Rank=2,Rank小的连向Rank大的。
路径压缩
上图中C的根节点是A,可以直接将C指向A,进行路径压缩操作。
优化后的代码实现
1 | class Node(object): |
LC #547
LeetCode第547题的答案就出来了:
1 | class Node(object): |