IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 王道数据结构源码实战ch4串 -> 正文阅读

[数据结构与算法]王道数据结构源码实战ch4串

Brute-Force算法

  • 匹配失败,需要回退,平均时间复杂度O(mn)
  • 最好时间复杂度O(m+n),每次匹配失败都在第一个字符就失败的情况下。
int BruteForce(char S[],char T[])   //不能用string类型的第0位置放长度
{
    int i=1,j=1;  //0号位置存储了字串的长度
    while(i<=S[0]&&j<=T[0])
    {
        if(S[i]==T[j])
        {
            i++;
            j++;
        }
        else
        {
            i=i-j+2;  //主串指针回退到这一轮比较的第一个元素的后一个。i-j表示主串回退到了上一次匹配的前一个,所以要再向后移两位
            j=1;  //模式串指针回退到第一个元素
        }
    }
    if(j>T[0])   //j大于自身长度时匹配成功
        return (i-T[0]);   //此时的i和j都已经移动了了模式串最后一个元素的后一个位置
    else
        return -1;
}
}

KMP算法

(字符串存储规则:0号位置放长度,从1号开始才放字符)

  • 基本思路:主串指针永远不回退,模式串每次可以整体后移多位,使得原本最大公共后缀的位置,由原本最大公共前缀来代替。具体每次后移多少,只与模式串本身有关。因此可以提前计算好next数组,根据当前主串的坏字符,就能立刻知道模式串后移多少位了
  • 匹配失败时,子串后移位数: 当前匹配上的长度-前后最长公共子串长度,就是后移位数,但是不需要我们考虑,因为模式串指针j前移相当于做了这件事。
  • 匹配失败时,子串指针j的回退位置:对于next数组,next[1]永远为0, next[2]永远为1。对于第j位字符(匹配失败的坏字符)前 共j-1位字符串中,前后最大公共子串长度+1,(为什么要+1,因为原来尾部的公共子串和头部的是一样的,不需要再次匹配,所以j回退到头部的公共子串后面一个位置开始下一轮匹配)
  • 公共前后缀短,是好事,因为模式串可以后移非常多位置
  • 需要找到前后缀最长的匹配,如果不是最长匹配,会导致模式串往后移动过多,错过正确匹配

计算next数组

void get_next(char T[],int next[])  //模式串自己和自己比较计算
{
    int i=1;
    int j=0;
    next[1]=0; //非常巧妙,第一个元素的next值是0;
    //abaabcac
    while(i<T[0])
    {
        if(j==0||T[i]==T[j])  //j==0,表示模式串回退到了开头
        {
            i++;
            j++;
            next[i]=j;   //记录出现重复的位置
        }
        else
            j=next[j];    //当前元素不相同,找新位置比较
    }
}

KMP主体

int KMP(char S[],char T[],int next[],int pos)
{
    int i=pos; //主串的起始位置
    int j=1;
    while(i<=S[0]&&j<=T[0])
    {
        if(j==0||S[i]==T[j])   //j==0是为了对应next[1]==0这个条件,只要看后面,匹配上一位,往后走
        {
            i++;
            j++;
        }
        else
        {
            j=next[j];  //匹配失败,j回退
        }
    }

    if(j>T[0])

        return i-T[0];
    else
        return -1;
}

完整代码

#include<bits/stdc++.h>
using namespace std;

int BruteForce(char S[],char T[])   //不能用string类型的第0位置放长度
{
    int i=1,j=1;  //0号位置存储了字串的长度
    while(i<=S[0]&&j<=T[0])
    {
        if(S[i]==T[j])
        {
            i++;
            j++;
        }
        else
        {
            i=i-j+2;  //主串指针回退到这一轮比较的第一个元素的后一个。i-j表示主串回退到了上一次匹配的前一个,所以要再向后移两位
            j=1;  //模式串指针回退到第一个元素
        }
    }
    if(j>T[0])   //j大于自身长度时匹配成功
        return (i-T[0]);   //此时的i和j都已经移动了了模式串最后一个元素的后一个位置
    else
        return -1;
}


void get_next(char T[],int next[])  //模式串自己和自己比较计算
{
    int i=1;
    int j=0;
    next[1]=0; //非常巧妙,第一个元素的next值是0;
    //abaabcac
    while(i<T[0])
    {
        if(j==0||T[i]==T[j])  //j==0,表示模式串回退到了开头
        {
            i++;
            j++;
            next[i]=j;   //记录出现重复的位置
        }
        else
            j=next[j];    //当前元素不相同,找新位置比较
    }
}


int KMP(char S[],char T[],int next[],int pos)
{
    int i=pos; //主串的起始位置
    int j=1;
    while(i<=S[0]&&j<=T[0])
    {
        if(j==0||S[i]==T[j])   //j==0是为了对应next[1]==0这个条件,只要看后面,匹配上一位,往后走
        {
            i++;
            j++;
        }
        else
        {
            j=next[j];  //匹配失败,j回退
        }
    }

    if(j>T[0])

        return i-T[0];
    else
        return -1;
}

int main()
{
    char S[256];  //主串
    char T[10];    //模式串
    int next[10]= {0};
    int pos1,pos2;
    S[0]=strlen("abcabaaabaabcacdf");
    strcpy(S+1,"abcabaaabaabcacdf");  //把字符串拷贝到S[1]开始的空间,存储的就是长度本身,而非对应的asc码值
    T[0]=strlen("abaabcac");
    strcpy(T+1,"abaabcac");

    //暴力匹配
    pos1=BruteForce(S,T);
    cout<<pos1<<endl;

    //KMP
    /*手算next数组结果
    next[1]=0;
    next[2]=1;
    next[3]=1;
    next[4]=2;

    next[5]=2;
    next[6]=3;
    next[7]=1;
    next[8]=2;
    */

    get_next(T,next);
    pos2=KMP(S,T,next,1);
    cout<<pos2<<endl;

    for(int i=1; i<=8; i++)
        cout<<next[i]<<" ";

    return 0;
}

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-03-04 15:50:05  更:2022-03-04 15:52:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 16:44:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码