Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换 成另一个所需要的最少操作次数,许可的编辑操作包括将一个字符替换成另一个字符, 插入一个字符,删除一个字符,编辑距离的算法是首先由俄国科学家Levanshtein 提出的 故又叫Levenshtein Distance。 例如: 字符串A : abcdefg 字符串B : abcdef 通过增加或是删掉字符“g” 的方式达到目的,这两种方案都需要一次操作。把这个操作 所需要的次数定义为两个字符串的距离。 要求: 给定任意连个字符串,写出一个算法计算它们的编辑距离。 数据范围: 给定的字符串长度满足1<= len(str) <= 10000 输入描述: 每组用例一共2行,为输入的两个字符串 输出描述: 每组用例输出一行,代表字符串的距离 示例: 输入: abcdefg abcdef 输出: 1
- 这是一道动态规划的题,规律 就是
- 1、某一点 处 string_a 和string_b 的位置相等,改点处的编辑距离是dp[row -1][col-1]
- 2、如果不相等则等于相邻三个点的中最小的加+1
- 填完表后,srring_a 到string_b 的编辑距离就是dp[n][m]
填表如下图: 代码如下:
def edit_distance():
"""编辑距离"""
string_a = input()
string_b = input()
m = len(string_a)
n = len(string_b)
dp = [[0 for _ in range(m + 1)] for _ in range(n + 1)]
for col in range(m + 1):
dp[0][col] = col
for row in range(n + 1):
dp[row][0] = row
for row in range(1, n+1):
for col in range(1, m+1):
if string_a[col-1] != string_b[row-1]:
dp[row][col] = min(dp[row - 1][col], dp[row - 1][col-1], dp[row][col-1]) + 1
else:
dp[row][col] = dp[row-1][col-1]
print(dp[n][m])
if __name__ == '__main__':
edit_distance()
|