字符串编辑距离

字符串编辑距离

Fast C++ CSV Parser 参考

复制代码
编辑距离,又称Levenshtein距离,WIKI,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。
许可的编辑操作包括:将一个字符替换成另一个字符,插入一个字符,删除一个字符。
俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
可以用来词相似度的比较。
python 复制代码
def normal_leven(str1, str2):
    len_str1 = len(str1) + 1
    len_str2 = len(str2) + 1

    matrix = [0 for n in range(len_str1 * len_str2)]

    for i in range(len_str1):
        matrix[i] = i
    for j in range(0, len(matrix), len_str1):
        if j % len_str1 == 0:
            matrix[j] = j // len_str1

    for i in range(1, len_str1):
        for j in range(1, len_str2):
            if str1[i - 1] == str2[j - 1]:
                cost = 0
            else:
                cost = 1
            matrix[j * len_str1 + i] = min(matrix[(j - 1) * len_str1 + i] + 1,
                                           matrix[j * len_str1 + (i - 1)] + 1,
                                           matrix[(j - 1) * len_str1 + (i - 1)] + cost)

    return matrix[-1]

if __name__ == '__main__':
    s1 = 'abcde'
    s2 = 'adcdef'
    print normal_leven(s1, s2)

输出:2,即abcde与adcdef的编辑距离是2

相关推荐
DIY机器人工房12 小时前
QT代码框架小案例:一个简单的时间类(Time)及其实例化程序,模拟了时间的设置、显示和自动流逝功能,类似一个简易电子时钟。
stm32·单片机·嵌入式硬件·嵌入式·diy机器人工房
bai54593616 小时前
STM32 硬件I2C读写MPU6050
stm32·单片机·嵌入式硬件
IT.小航16 小时前
STM32F103RC的USB上拉电阻1.5K
stm32·单片机·嵌入式硬件
淘晶驰AK21 小时前
51单片机与stm32单片机,先学习哪一个?
stm32·单片机·51单片机
wind_one11 天前
项目:电动车报警器
stm32·单片机·嵌入式硬件
网易独家音乐人Mike Zhou1 天前
【Python】圆柱体内部3D点云仿真及ply文件生成,圆形3D点云检测及拟合算法
stm32·单片机·mcu·物联网·算法·点云·iot
猫猫的小茶馆1 天前
【STM32】HAL库中的实现(九):SPI(串行外设接口)
stm32·单片机·嵌入式硬件·mcu·物联网·51单片机·智能硬件
机器视觉知识推荐、就业指导1 天前
STM32 外设驱动模块五:DHT11 温湿度传感器
stm32·单片机·嵌入式硬件
灬若宸2 天前
14、外部中断
stm32·单片机·嵌入式硬件·系统架构
GodKK老神灭2 天前
STM32 AFIO模块
stm32·单片机·嵌入式硬件