不知道该怎么解释kmp算法,我的解释肯定也不专业以及清晰,因此,在初步了解kmp算法之后,再通过这道题及其注释 来更好理解kmp吧
实现 strStr()
由kmp可知,我们在解决此类题时,需要两个大步骤, 第一步是 找到needle的next数组 next数组,即needle字符串中,每个字母所对应的最长前后缀长度 第二步是 在haystack字符串 和 needle字符串中,分别用 i,j指向它们,一个一个比较是否相同 如图所示: 若两个字母不同,则用前面求的next数组找到j回溯的位置,eg:当i指向’T’,j指向’Y’,此时,需要让j回溯next[7]=2的位置,如图所示
若字母相同 则i,j 都向后移一位
若在比较第一个字母的时候就不一样,则 需要将haystack中的i向后移一位,j不动(意思上是不动,代码不是这样写)
以下是AC代码
class Solution
{
public:
int strStr(string haystack, string needle)
{
if(needle.size() == 0)
return 0;
int i = -1, j = 0;
vector<int> next(needle.size(),0);
next[0] = -1;
while(j < needle.size() - 1)
{
if(i < 0 || needle[i] == needle[j])
{
j++;
i++;
next[j] = i;
}
else
i = next[i];
}
int n = haystack.size();
int m = needle.size();
i = 0, j = 0;
while(i < n && j < m)
{
if(j < 0 || haystack[i] == needle[j])
{
i++;
j++;
}
else
j = next[j];
}
if( j == m)
return i-j;
return -1;
}
};
关于以下代码的意义
int n = haystack.size();
int m = needle.size();
string.size() 返回值的类型是 unsigned long 数据类型不同,int和unsigned long直接比较会出问题
eg:
int a = -1;
unsigned int b = 1;
int 型与unsigned int 型在自己没有进行强制转换的情况下进行比较。int类型在linux下默认强制转换为unsigned int类型进行比较,所以a与b比较的时候,a会自动转换成unsigned int类型进行比较。由于signed int的符号位最高位是1,转换成unsigned int之后,就会变成一个很大的unsigned int型正数
//下面是题外话 数组与字符串 完结撒花~
|