怎么计算Damerau Levenshtein距离?

  统计/机器学习 自然语言处理 描述性统计    浏览次数:3398        分享
1

Damerau Levenshtein距离可以计算两个字符串的距离(距离越小,说明越相似)

网上资料不多,有没有具体的计算公式?谢谢!

 

didod   2018-12-25 01:41



   1个回答 
9

下面几种情况下,字符串1和字符串2的Damerau Levenshtein距离是1:

     1)对字符串1插入一个字符得到字符串2;

     2)对字符串1删除一个字符得到字符串2;

     3)替换字符串1中的一个字符,得到字符串2;

     4)交换字符串1中相邻的两个字符,得到字符串2。

比如说,'abc'和'ab'的Damerau Levenshtein距离是1;'abc'和'bbc'的Damerau Levenshtein距离是1;'abc'和'bac'的Damerau Levenshtein距离是1。

具体的公式可以参考维基百科Damerau–Levenshtein距离

SofaSofa数据科学社区DS面试题库 DS面经

Lydia   2019-01-10 10:03

多谢 - didod   2019-01-20 11:47


  相关讨论

自然语言处理中的Tf-idf是什么意思

文本处理中stop word什么意思

“阅读需要X分钟”这个功能是如何实现的?

nlp里的stemming是什么意思?

文本处理中的tf是什么意思?如何计算?

怎么判断一句中文话语是否通顺

jieba分词中最大正向匹配法是什么?

python里实现词云的package

如何用python统计一个txt文本的行数

jieba分词怎么用?

  随便看看

推荐系统有哪些常用的评价标准

NLP里的OOV是什么意思?

dropout rate一般设置多大?

查看sklearn的线性回归系数的p value

numpy.array转换为图片并显示出来