IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> kmp算法之我见 -> 正文阅读

[数据结构与算法]kmp算法之我见

KMP算法是一个著名的字符串匹配算法,效率很高,整体思路其实还是比较好理解,比较难理解的部分在于前缀函数。

  • 整体思路:
    字符串1: | A | B | C | D | A | B | C | D | A | B | X |
    字符串2: | A | B | C | D | A | B | Y |

对于字符串1和字符串2,在 C和Y字符上不匹配,只需将字符吕串2移动到下面的位置,再继续进行比较即可,而不用像暴力破解的方法那样一位一位进行比较:
字符串1: | A | B | C | D | A | B | C | D | A | B | X |
字符串2: | _ | _ | __ | _ | A | B | C | D | A | B | Y |

这里,就牵涉到所谓前缀函数的求解,主要就是字符串2,首末存在相同子串时(不是镜像子串,即不是 abxxxba,而是 abyyab这样的情形),在第 i 位上与字符串1上对应的字符开始不一致,应该移动到哪里。

  • 前缀函数
    关于前缀函数的代码网上有很多,这里直接上代码,
//  这里求字符串needle的前缀函数,m为needle的长度
for i, j := 1, 0; i < m; i++ {
    for j > 0 && needle[i] != needle[j] {
        j = next[j-1]
    }
    if needle[i] == needle[j] {
        j++
    }
    next[i] = j
}

其中,比较难理解的是这里

    ...
    for j > 0 && needle[i] != needle[j] {
        j = next[j-1]
    }
    ...

直接举个例子,就能明白这里为什么要这么处理了

needle = “ABCABDABCABCe”
m = 13
i = 11 ( C ) // sub_str = “ABCABDABCABC”
j = 5 ( D ) // sub_str = “ABCABD”
始终要牢记,我们需要找到 i 的相同前缀
这里 needle[i] != needle[j],不是相同前缀,但前面已经有长度为 j 个字符是相同的( “ABCAB”,当前坐标是j,即j+1个字符导致不是相同前缀,前面的字符串长充是 j); 那么要满足 i 的相同前缀,就要在这个 j 长度的子串中找到这个子串的相同缀,且该前缀的后面一个字符是 C (=needle[i])

另外,next[i]是相同前缀的长度,当进行一 次 j = next[j-1] 后,needle[j] 指向的就是相同前缀子串的后面一个字符。那么在求解next[i]时,就只需要迭代进行 j = next[j-1] 直到needle[j] == needle[i]

  • 求解
    结合整体思路和前缀函数,在字符串a 中找到字符串b 的过程就相当于在 b + a 中找到长度为 b长度 的相同前缀,且直接从字符串 a 处开始遍历就可以了。答案网上有很多就不解释了,直接上答案
func strStr(haystack, needle string) int {
    n, m := len(haystack), len(needle)
    if m == 0 {
        return 0
    }
    pi := make([]int, m)
    for i, j := 1, 0; i < m; i++ {
        for j > 0 && needle[i] != needle[j] {
            j = pi[j-1]
        }
        if needle[i] == needle[j] {
            j++
        }
        pi[i] = j
    }
    for i, j := 0, 0; i < n; i++ {
        for j > 0 && haystack[i] != needle[j] {
            j = pi[j-1]
        }
        if haystack[i] == needle[j] {
            j++
        }
        if j == m {
            return i - m + 1
        }
    }
    return -1
}
来源:[力扣(LeetCode28)](https://leetcode-cn.com/problems/implement-strstr/solution/shi-xian-strstr-by-leetcode-solution-ds6y/)
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-02-03 01:23:43  更:2022-02-03 01:24:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 17:47:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码