怎么计算Damerau Levenshtein距离?

  统计/机器学习 自然语言处理 描述性统计    浏览次数:289        分享
1

Damerau Levenshtein距离可以计算两个字符串的距离(距离越小,说明越相似)

网上资料不多,有没有具体的计算公式?谢谢!

 

didod   2018-12-25 01:41



   1个回答 
8

下面几种情况下,字符串1和字符串2的Damerau Levenshtein距离是1:

     1)对字符串1插入一个字符得到字符串2;

     2)对字符串1删除一个字符得到字符串2;

     3)替换字符串1中的一个字符,得到字符串2;

     4)交换字符串1中相邻的两个字符,得到字符串2。

比如说,'abc'和'ab'的Damerau Levenshtein距离是1;'abc'和'bbc'的Damerau Levenshtein距离是1;'abc'和'bac'的Damerau Levenshtein距离是1。

具体的公式可以参考维基百科Damerau–Levenshtein距离

SofaSofa数据科学社区 DS面经 问答 实战

Lydia   2019-01-10 10:03

多谢 - didod   2019-01-20 11:47


  相关主题

文本处理中stop word什么意思   2回答

自然语言处理中的Tf-idf是什么意思   2回答

nlp里的stemming是什么意思?   2回答

文本处理中的tf是什么意思?如何计算?   1回答

用python统计字符串中空格的个数   3回答

wordcloud安装报错error: Microsoft Visual C++ 14.0 is required   1回答

python里实现词云的package   3回答

如何用python统计一个txt文本的行数   3回答

怎么把英文字符串转为小写(python)?   2回答

自然语言处理中的分词是什么意思?   1回答

word2vec怎么处理一词多义的情况?   2回答

请问NLP中这种编码方式有没有什么术语?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!