滑动窗口(字符串)-算法入门
滑动窗口概述
滑动窗口,大致就是维护一个区间去遍历一段数据,类似于双指针算法,那么用区间去遍历有什么好处吗?用一个区间去遍历的话,区间内会有原来的计算结果,避免重复计算,从而降低达到降低时间复杂度的目的。在算法题中常常用于找到满足某条件下,字符串或数组的字串或子数组的问题中。下面用两个例题来简单介绍一下,滑动窗口具体是如何运行的。
**题目描述:**给你两个字符串 s1 和 s2 ,写一个函数来判断 s2 是否包含 s1 的排列。如果是,返回 true ;否则,返回 false ;换句话说,s1 的排列之一是 s2 的 子串 。
输入:s1 = "ab" s2 = "eidbaooo"
输出:true
解释:s2 包含 s1 的排列之一 ("ba").
输入:s1= "ab" s2 = "eidboaoo"
输出:false
输入只包含小写字母
解决方案:
class Solution {
public:
bool checkInclusion(string s1, string s2) {
vector<int> cnt1(26), cnt2(26);
int m = s1.size(), n = s2.size();
if(m > n) return false;
for (int i = 0; i < m; i++) {
++cnt1[s1[i] - 'a'];
++cnt2[s2[i] - 'a'];//创建初始窗口
}
if (cnt1 == cnt2) return true;
for (int i = 0; i + m < n; i++) {
--cnt2[s2[i] - 'a'];
++cnt2[s2[i + m] - 'a'];//维护窗口
if (cnt1 == cnt2) return true;
}
return false;
}
};
**分析:本题的目的是短串是否匹配到长串中的字串,而且从题目可见字串是没有顺序的,关于这个顺序性问题,我们可以用将字符转化为数字的方式解决(s1[i] - 'a' ),把a-z的字符转到 0-25的数字,这样还可以顺带解决有重复字母的情况,我们只需要++cnt[i]**即可,再来看我们的窗口是如何维护的,我们每一次循环将窗口最左边的值丢弃,将窗口最右边的下一个值加入,再与要匹配的字串对比,如果成功则返回true,走完全程,没有匹配到,那么匹配失败,返回false。
可以看到我们维护这个窗口的值是静态的,大小和待匹配的字串相同。下面我们来解决一道,窗口会变化的题目
**题目描述:**给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。
示例 1:
输入: s = "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:
输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
解决方案:
class Solution {
public:
int lengthOfLongestSubstring(string s) {
unordered_set<char> hash;
int n = s.size();
int rk = -1, ans = 0;
for (int i = 0; i < n; i++) {
if (i != 0) hash.erase(s[i-1]);
while (rk+1 < n && !hash.count(s[rk+1])) {
hash.insert(s[rk+1]);
rk++;
}
ans = max(ans, rk - i + 1);
}
return ans;
}
};
分析:
这个题目需要用到一些哈希表的知识,可以去了解一下算法的主体部分是维护了一个以i为头,以rk为尾的动态窗口,每一次循环中,固定头部i,然后用尾部的rk去遍历,只要hash表内部没有该字符,便将它加入,rk+1 将尾部继续延长,直到出现重复字符,更新最大长度即窗口大小(rk - i + 1),然后可以发现此时**[i,rk]内的字符是不重复的,那么[i+1,rk]内的字符也是不重复的,我们可以利用上一次的计算结果,将i**剔除出哈希表中,让rk继续往后遍历,接着更新字符最大长度。
总结
滑动窗口个人感觉是双指针的一种特例或说一种巧用,用首尾维护一个区间(窗口),来通过保留部分过去已经计算的结果,滑动得到新的结果,避免重复计算,然后降低时间复杂度,避免重复计算。
参考文献
以上例题均来自leetcode
|