IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 4304 字符串归类(枚举技巧 + 并查集) -> 正文阅读

[数据结构与算法]4304 字符串归类(枚举技巧 + 并查集)

1. 问题描述:

给定 n 个由小写字母构成的字符串。现在,请你对它们进行归类。对于两个字符串 a 和 b:
如果至少存在一个字母在 a 和 b 中同时出现,则 a 和 b 属于同一类字符串。
如果字符串 c 既与字符串 a 同类,又与字符串 b 同类,则 a 和 b 属于同一类字符串。
请问,最终所有字符串被划分为多少类。

输入格式

第一行包含整数 n。接下来 n 行,每行包含一个仅由小写字母构成的字符串。注意,输入字符串可能相同。

输出格式

一个整数,表示最终所有字符串被划分为的类的数量。

数据范围

前 6 个测试点满足 1 ≤ n ≤ 10。
所有测试点满足 1 ≤ n ≤ 2 × 10 ^ 5,输入字符串的长度范围 [1,50],所有输入字符串的总长度范围 [1,10 ^ 6],所有字符串均由小写英文字母构成。

输入样例1:

4
a
b
ab
d

输出样例1:

2

输入样例2:

3
ab
bc
abc

输出样例2:

1

输入样例3:

1
abcdefghijklmn

输出样例3:

1
来源:https://www.acwing.com/problem/content/description/4307/

2. 思路分析:

分析题目可以知道已知若干个字符串的集合,每一个集合中有相同元素的时候那么他们属于同一个集合,我们需要合并这些具有相同元素的集合,由合并集合这个特点可以知道这道题目属于并查集的模型,所以问题就转化为了如何快速判断两个集合是否有相同的字母,因为数据规模比较大所以我们不能同时枚举两个字符串然后判断是否有相同的字符,需要优化一下,这里使用到的一个技巧是枚举每一个字符串中的每一个字母,使用数组idx来记录26个字母第一次出现的位置,判断当前枚举的字母是否是第一次出现如果不是第一次出现那么使用并查集的find操作找到当前枚举的第i个位置的父节点和当前字母第一次出现位置的父节点,如果他们不属于同一个集合的时候那么就合并这两个集合(需要先判断一下是否属于同一个集合因为有可能之前已经合并过了),时间复杂度为O(ns),其中n为字符串的数目,s为输入字符串的长度,为2 * 10 ^ 5 * 50 = 10 ^ 7,所以是可以通过的:

3. 代码如下:

from typing import List
import sys

class Solution:
    # 并查集, 寻找x的父节点, 寻找父节点的时候进行路径压缩
    def find(self, x: int, p: List[int]):
        if p[x] != x: p[x] = self.find(p[x], p)
        return p[x]

    # 本质上考察的就是并查集
    def process(self):
        n = int(input())
        p = [0] * (n + 10)
        for i in range(1, n + 1): p[i] = i
        # 注意需要从下标为1开始这样后面判断是否是0就可以知道是不是第一次出现了
        idx = [0] * 26
        # 一开始为n个集合
        res = n
        for i in range(1, n + 1):
            s = input()
            for j in range(len(s)):
                k = ord(s[j]) - ord("a")
                # 当前字符之前已经出现过
                if idx[k] > 0:
                    a, b = self.find(i, p), self.find(idx[k], p)
                    # 之前没有合并过才合并
                    if a != b:
                        # 合并之后集合的数目减1
                        res -= 1
                        p[a] = b
                else:
                    idx[k] = i
        return res


if __name__ == '__main__':
    # 设置递归的最大调用次数防止爆栈
    sys.setrecursionlimit(200010)
    print(Solution().process())
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-03-06 13:22:01  更:2022-03-06 13:23:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 2:27:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码