字符串编辑距离

字符串编辑距离

Fast C++ CSV Parser 参考

复制代码
编辑距离,又称Levenshtein距离,WIKI,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。
许可的编辑操作包括:将一个字符替换成另一个字符,插入一个字符,删除一个字符。
俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
可以用来词相似度的比较。
python 复制代码
def normal_leven(str1, str2):
    len_str1 = len(str1) + 1
    len_str2 = len(str2) + 1

    matrix = [0 for n in range(len_str1 * len_str2)]

    for i in range(len_str1):
        matrix[i] = i
    for j in range(0, len(matrix), len_str1):
        if j % len_str1 == 0:
            matrix[j] = j // len_str1

    for i in range(1, len_str1):
        for j in range(1, len_str2):
            if str1[i - 1] == str2[j - 1]:
                cost = 0
            else:
                cost = 1
            matrix[j * len_str1 + i] = min(matrix[(j - 1) * len_str1 + i] + 1,
                                           matrix[j * len_str1 + (i - 1)] + 1,
                                           matrix[(j - 1) * len_str1 + (i - 1)] + cost)

    return matrix[-1]

if __name__ == '__main__':
    s1 = 'abcde'
    s2 = 'adcdef'
    print normal_leven(s1, s2)

输出:2,即abcde与adcdef的编辑距离是2

相关推荐
YouEmbedded44 分钟前
解码STM32定时器:原理、配置与实战
stm32·定时器·pwm·sg90舵机
羊小猪~~1 小时前
【QT】-- QT基础类
开发语言·c++·后端·stm32·单片机·qt
Q_21932764552 小时前
基于STM32的智能家居安防系统设计
网络·stm32·智能家居
BreezeJuvenile3 小时前
STM32_存储器与寄存器详细介绍
stm32·存储器·寄存器
小尧嵌入式3 小时前
【基础学习七十】ffmpeg命令
c++·stm32·嵌入式硬件·ffmpeg
北京盟通科技官方账号4 小时前
Windows 平台 EtherCAT 实时控制:从抖动抑制到虚拟化架构解析
stm32·单片机·嵌入式硬件
foundbug9994 小时前
基于STM32F103单片机实现汽车OBD诊断仪的开发方案
stm32·单片机·汽车
一枝小雨4 小时前
【OTA专题】 20 上电立即跳转:加快MCU启动速度
stm32·单片机·嵌入式·ota·bootloader·加速启动
物联网牛七七5 小时前
2、stm32f407学习笔记-存储器和寄存器以及映射
笔记·stm32·学习
小李做物联网5 小时前
【单片机毕设】38.1基于单片机stm32智能空气处理毕业设计
stm32·单片机·嵌入式硬件·物联网