BF算法
字符串:“abcd” 真子串:’ ‘,‘a’,‘b’,‘c’,‘d’,‘ab’,‘bc’,‘cd’,‘abc’,‘bcd’ ?(1+n)*n/2 子串:’ ',‘a’,‘b’,‘c’,‘d’,‘ab’,‘bc’,‘cd’,‘abc’,‘bcd’,‘abcd’ ? (1+n)*n/2+1
主串:“ababcabcdabcde” ? pos 0 return 5(pos代表主串所指向字母的下标,return代表遇到和子串一致的主串中的元素下标) 子串:"abcd’? pos 7 return 9
BF算法:暴力求解 主串:“ababcabcdabcde”?i指向主串的第一个位置 子串:"abcd’?j指向子串的第一个位置
1.第一种BF算法(这种是错误的)
如果i和j指向的字符相同,则i++,j++; 如果i和j指向的字符不相同,则j=0,重新开始比较; 退出条件:当i或者j向后走,越界了 看子串在主串中找到没找到只用看j即可,j如果走出自身范围,则找到了,否则没找到,如果找到,返回i-j 但是有一个例子: 主串:“aaaaaaaaaaaaab” 子串:“aaaaaaaaaaaab” 此时第一种b=BF算法是不适用的,所以是错误的。
1.第二种BF算法
如果i和j指向的字符相同,则i++,j++; 如果i和j指向的字符不相同,则i=i-j+1,j=0;
退出条件:当i或者j走出自身范围(越界) 退出之后,需要判断到底子串在主串中是否出现,只需要判断j即可 j如果走出自身范围,则找到了,return i-j; j如果没有走出自身范围,则没有找到,return -1;
2.BF算法代码实现
#include <stdio.h>
#include <assert.h>
#include <stdlib.h>
#include <string.h>
int BF_Search(const char *str, const char *sub, int pos)
{
assert(str!=NULL && sub!=NULL && pos>=0 && pos<strlen(str));
int i = pos;
int j = 0;
int len_str = strlen(str);
int len_sub = strlen(sub);
while(i<len_str && j<len_sub)
{
if(str[i] == sub[j])
{
i++;
j++;
}
else
{
i = i-j+1;
j = 0;
}
}
if(j < len_sub)
{
return -1;
}
else
{
return i-j;
}
}
int main()
{
const char* str = "ababcabcdabcde";
const char* sub = "abcd";
int tmp = BF_Search(str, sub, 3);
if (tmp >= 0)
{
printf("找到了,开始下标为%d\n", tmp);
}
else
{
printf("没有找到\n");
}
return 0;
}
3.运行结果
data:image/s3,"s3://crabby-images/b321c/b321c6dba8aa17810d7cdab3d3ca7cba82420053" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/a0b60/a0b606cdfffb120ca259ee689df6b2a94382b681" alt="在这里插入图片描述"
4.BF算法复杂度
data:image/s3,"s3://crabby-images/8f060/8f060f3260f60b0e9765d8e2ed1f1c81dc8d72b2" alt="在这里插入图片描述" 所以,BF算法的时间复杂度为O(n*m)
BF算法的优缺点: 优点: 逻辑简单,实现也简单 缺点: 效率很低,时间复杂度O(n*m)
KMP算法
1.核心思想: i绝不后退
data:image/s3,"s3://crabby-images/fb95b/fb95bd773186f1311133613a4c756b88a16d7a18" alt="在这里插入图片描述" 此时,发生了失配,然后通过观察可以得知,失配前已经匹配成功的那些字符,存在两种情况: 1.互相不相等的情况下,i就可以不用回退(i就算回退了,也肯定会失败) 过程如下: 例1: data:image/s3,"s3://crabby-images/300d0/300d0ec0ee8405aaa197ad4f140064e0cf8fb0fe" alt="在这里插入图片描述" 例2: data:image/s3,"s3://crabby-images/fd7f9/fd7f9e293d18b1f86c2261670c5ad69e1efc7a22" alt="在这里插入图片描述"
data:image/s3,"s3://crabby-images/a7391/a73915c53ebf1f51b9aa8b1367b5a169ac60bd8c" alt="在这里插入图片描述" 上述说道,如果发生失配时,失配前的字符串互不相等,i可以不用回退; 如果发生失配时,失配前的字符串互有相等情况,i可能需要向前回退,只不过,我们只要证明 左绿那条线 和 上橙那条线 相等,那么i也就可以不用回退,而是让j不再回退到0,而是回退到一个合适的位置,去代替掉
现在重点就在:需要去证明左绿和.上橙相等(因为橙色上下两条线铁定相等,那么我们只需要关注子串即可,证明左绿和右绿存在即可)(证明左绿和上橙相等可以用证明左绿和右绿相等代替掉)
2.代码实现
int* Get_Next(const char* sub)
{
assert(sub != NULL);
int len = strlen(sub);
int* next = (int*)malloc(len * sizeof(int));
assert(next != NULL);
next[0] = -1;
next[1] = 0;
int j = 1;
int k = next[1];
while (j + 1 < len)
{
if (k == -1 || sub[j] == sub[k])
{
k++;
j++;
next[j] = k;
}
else
{
k = next[k];
}
}
return next;
}
int KMP_Search(const char* str, const char* sub, int pos)
{
assert(str != NULL && sub != NULL && pos >= 0 && pos < strlen(str));
int i = pos;
int j = 0;
int len_str = strlen(str);
int len_sub = strlen(sub);
int* next = Get_Next(sub);
while (i < len_str && j < len_sub)
{
if (j == -1 || str[i] == sub[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}
if (j < len_sub)
{
return -1;
}
else
{
return i - j;
}
}
int main()
{
const char* str = "ababcabcdabcde";
const char* sub = "abcd";
int tmp = KMP_Search(str, sub, 3);
if (tmp >= 0)
{
printf("找到了,开始下标为%d\n", tmp);
}
else
{
printf("没有找到\n");
}
return 0;
}
3.运行结果
data:image/s3,"s3://crabby-images/72cc2/72cc2ffdb58f5dc1a3ccfa881a8c42f0063b4987" alt="在这里插入图片描述"
4.复杂度分析
KMP算法的时间复杂度为:O(n+m)
|