IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> 详讲KMP算法 -> 正文阅读

[C++知识库]详讲KMP算法

目录

前言:

BF算法

KMP算法

算next数组

?编辑?next数组的结论讲解

?next数组的创建

kmp代码实现讲解

KMP的代码汇总? ? ?


前言:

我们应该知道字符串函数strstr---字符串查找,实现它的有两种方法:

第一种方法:BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-------来自百度

第二种方法:KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)?[1]??。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -------来自白度?

BF算法

BF算法的图文解析

?BF算法的代码实现

#include <stdio.h>
#include <assert.h>
#include <string.h>
#include <stdlib.h>
int BF(char *str, char *sub)
{
	assert(str != NULL && sub != NULL);
	if (str == NULL || sub == NULL)
	{
		return -1;
	}

	int i = 0;
	int j = 0;
	int strLen = strlen(str);
	int subLen = strlen(sub);
	while (i < strLen && j < subLen)
	{
		if (str[i] == sub[j])
		{
			i++;
			j++;
		}
		else
		{
			//回退
			i = i - j + 1;
			j = 0;
		}
	}
	if (j >= subLen)
	{
		return i - j;
	}
	return -1;
}
int main()
{
	printf("%d\n", BF("ababcabcdabcde", "abcd"));
	printf("%d\n", BF("ababcabcdabcde", "abcde"));
	printf("%d\n", BF("ababcabcdabcde", "abcdef"));
	return 0;
}

KMP算法

在学习kmp算法之前,我们更需要理解一下它的逻辑;我们这里讲解主要从三个版块:next数组的代码实现,kmp算法的代码实现,主函数对kmp的调用;关于next数组也需要从三个方面介绍:如何算next数组,next数组的结论,next结论在代码的实现;关于kmp算法代码实现我们主要需要知道:bf算法与kmp算法的不同之处,kmp算法的实现。

算next数组

练习 1: 举例对于”ababcabcdabcde”, 求其的 next 数组?
-1 0 0 1 2 0 1 2 0 0 1 2 0 0
练习 2: 再对”abcabcabcabcdabcde”,求其的 next 数组? "----不做讲解, 自己实现
-1 0 0 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0

练习 1的图文讲解

?next数组的结论讲解

?next数组的创建

?创建next数组有两种情况:

1.如果p[i]==p[k]->next[i]=k;

? 2.如果p[i]!=p[k]->next[i]=k;

?

代码实现?

void GetNext(int *next, const char *sub)
{
	assert(next&&sub);

	int sublen = strlen(sub);
	next[0] = -1;
	next[1] = 0;

	int i = 2;
	int k = 0;

	while (i < sublen)
	{
		if ((k == -1) ||sub[i - 1] == sub[k])//两种情况1.如果next数组下标是与k相等,那么就等于k+1 这个是next数组的性质
			                    //2.如果不相等,将test中k的坐标赋予k	 
		{
			next[i ] = k + 1;//
			i++;
			k++;
		}
		else
		{
			k = next[k]; //列如最开始sub数组中i和k的值就不相等,这里k=0;next[k]=-1;k=-1+1=0;next[i]=0;
		}
	}

kmp代码实现讲解

为什么主串不回退??

?假设目前在2号位置匹配失败,就算回到1的位置,也是没有必要的,1的位置字符b和子串0的位置a也不一样。所以我们移动i是没有必要的。

子串退回位置

?此时匹配失败,我们不进回退i,因为在这个地方匹配失败,说明i的前面和j前面,是有一部分相同的,不然两个下标是不可能走到这里来的。 所以我们看这个图如果j退回到这里是最好。

kmp阶段的代码

int KMP(char* str,const char* sub, int pos)//pos是不会变的,指向sub中的地址
{
	assert(str&&sub);
	int i =pos;//遍历主串
	int j =0;//遍历子串

	int slen = strlen(str);
	int sublen = strlen(sub);

	int* next = (int*)malloc(sublen*sizeof(int));
	assert(next);

	if (next == NULL)
	{
		return - 1;
	}
	GetNext(next, sub);

	while (j < sublen && i < slen)
	{
		if ((j == -1) || str[i] == sub[j])
		{
			i++;
			j++;
		}
		else
		{
			j = next[j];//因为next数组的特性,其中有重复,每次不相等就将j的next数组的坐标重新赋予到j进行比较,
		}
	}
	free(next);
	if (j >= sublen) 
	{
		return  i- j;
	}
	else
	{
		return -1;
	}

}

KMP的代码汇总? ? ?

#include <stdio.h>
#include <assert.h>
#include <string.h>
#include <stdlib.h>

	void GetNext(int *next, const char *sub)
{
	assert(next&&sub);

	int sublen = strlen(sub);
	next[0] = -1;
	next[1] = 0;

	int i = 2;
	int k = 0;

	while (i < sublen)
	{
		if ((k == -1) ||sub[i - 1] == sub[k])//两种情况1.如果next数组下标是与k相等,那么就等于k+1 这个是next数组的性质
			                    //2.如果不相等,将test中k的坐标赋予k	 
		{
			next[i ] = k + 1;//
			i++;
			k++;
		}
		else	{
			k = next[k]; //列如最开始sub数组中i和k的值就不相等,这里k=0;next[k]=-1;k=-1+1=0;next[i]=0;
		}
	}

}
//
int KMP(char* str,const char* sub, int pos)//pos是不会变的,指向sub中的地址
{
	assert(str&&sub);
	int i =pos;//遍历主串
	int j =0;//遍历子串

	int slen = strlen(str);
	int sublen = strlen(sub);

	int* next = (int*)malloc(sublen*sizeof(int));
	assert(next);

	if (next == NULL)
	{
		return - 1;
	}
	GetNext(next, sub);

	while (j < sublen && i < slen)
	{
		if ((j == -1) || str[i] == sub[j])
		{
			i++;
			j++;
		}
		else
		{
			j = next[j];//因为next数组的特性,其中有重复,每次不相等就将j的next数组的坐标重新赋予到j进行比较,
		}
	}
	free(next);
	if (j >= sublen) 
	{
		return  i- j;
	}
	else
	{
		return -1;
	}

}

int main()
{
	char *str = "ababcabcdabcde";
	char *sub = "abcd";
	printf("%d\n", KMP(str, sub, 0));

	return 0;
}

如果看的似懂非懂,那么我建议去看看大博哥的视频 ,点击:大博哥?,最后感谢大家支持!!? !? !

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2022-07-21 21:19:47  更:2022-07-21 21:21:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 12:55:44-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码