C#:字符串相似度算法( Levenshtein Distance算法)

来源:互联网 发布:一级建造师题库软件 编辑:程序博客网 时间:2024/05/18 22:12

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

网上有很多关于此算法的源代码,但其中一些存在Bug,如百度搜索排名靠前的:

http://www.cppblog.com/whncpp/archive/2008/09/21/62378.html

Bug:matrix[0][0]没有初始化

此外,几乎所有的代码都没有考虑是否忽视字母大小写的问题,因此我用C#重新实现此算法。

 

测试代码:

 

原创粉丝点击