ADT
定义和特点
特点:串长远远大于字符种类 data:image/s3,"s3://crabby-images/ff24c/ff24c83e80a85704d13c9a63f52ece382fde780b" alt="串定义和特点"
术语
data:image/s3,"s3://crabby-images/84326/84326214bbd1688c4b4d43dfc931e36bfaedf092" alt="substr()"
ADT接口实现
data:image/s3,"s3://crabby-images/2f943/2f943701344735e84ea0dad5f80d1921de9f67f7" alt="ADT接口实现"
模式匹配
问题与需求
主要解决4个问题。 data:image/s3,"s3://crabby-images/d397d/d397d7fce13fd9088bdd1e253a07a15b37c8c90c" alt="四个问题解决"
算法测试方法
成功与失败的情况分开来测试。 data:image/s3,"s3://crabby-images/0c5e7/0c5e7e3208632e3e136913ccc3982a58e94e7ada" alt="成功与失败的情况分开"
蛮力匹配
构思
- 自左向右,以字符为单位,依次移动模式串直到在某个位置发现匹配
data:image/s3,"s3://crabby-images/d4214/d421460ba39ab2527d6c29b1dab2a8a9f17bc99c" alt="在这里插入图片描述"
蛮力匹配:版本1
i-j 大于n-m 即可判定失败。因为失败时 (字符串T)i=n,(模板串P)j<m。 i-j<=n-m 即可判定成功 i-j的意义是字符串中与模板串开始比较的位置。
data:image/s3,"s3://crabby-images/18210/182103931ad0c64cd71ddef82fe0452e5c831327" alt="蛮力匹配版本1"
蛮力匹配:版本2
data:image/s3,"s3://crabby-images/a4529/a4529a9b4f4deecef7b52e63e23deb19a063dd5f" alt="蛮力2"
蛮力匹配:性能分析
- 最好最坏情况复杂度分析
data:image/s3,"s3://crabby-images/dc160/dc16056357e0c38385d40ccf5b7923db57e99dd7" alt="在这里插入图片描述"
- 最坏情况例子
字母表={0,1} 成功次数m-1次,失败次数1 data:image/s3,"s3://crabby-images/e2f5a/e2f5a332283c5c0a817a86461925b17d5aab9496" alt="在这里插入图片描述"
-
特点 data:image/s3,"s3://crabby-images/eff08/eff08d8ba1dd25912e41f49d352e6605eaf49d2f" alt="在这里插入图片描述" -
蛮力算法为何低效
- 有重复匹配的前缀:即一个字符串T中的一个位置需要比对多次。
- 不变性:模板P总是右移一位去比对。不会根据情况改变
KMP算法
查询表
data:image/s3,"s3://crabby-images/93122/931223d4104cd27f5b05df3a1dfab971f6eb5b56" alt="在这里插入图片描述"
理解next【】表
理解N ( p , j )={ 0 <= t<j | P [ 0, t ) == P[ j-t , j ) }; data:image/s3,"s3://crabby-images/3d856/3d856de64483412addbbd11a2df6fe20a71c80a0" alt="next【】表"
- 具有特点:
快速右移 避免回溯 next【0】=-1
构造next【】表
- 当p【j】== p【 next [ j ] 】
计算next【j+1】 data:image/s3,"s3://crabby-images/c87cd/c87cd5364ef6628c17a9570c00969c43e3dc18b4" alt="在这里插入图片描述"
- 当p【j】!= p【 next [ j ] 】时
data:image/s3,"s3://crabby-images/badb8/badb8714a7f54a99bd868567dda1257393582337" alt="在这里插入图片描述"
next【】表代码实现
data:image/s3,"s3://crabby-images/173d1/173d13209e1e50d30f5805774a8126b1f263b296" alt="在这里插入图片描述"
KMP复杂度准确分析 ——线性时间O(n)
设一个k=2i-j (分析方法忽略吧) data:image/s3,"s3://crabby-images/c0369/c0369df3d77c685a37f6538737dbbb445eb02801" alt="在这里插入图片描述"
KMP算法改进版
data:image/s3,"s3://crabby-images/e63b7/e63b7865a07bfcbb3d0ea01b10dda180dcbc65ee" alt="KMP算法为改进前的重复比对"
改进的原因:在当前模式串P的元素重复,使得连续与文本串T的元素进行对比失败,产生冗余,故可跳过相同元素与T的重复比对,提高KMP算法性能 data:image/s3,"s3://crabby-images/c38aa/c38aa533e90c94a57824c3156795b98eb830daa3" alt="在这里插入图片描述"
|