python比较文本相似度(not semantical)

来源:互联网 发布:鲁班预算软件 编辑:程序博客网 时间:2024/04/29 21:57

statement:这里的文本相似度不是指语义相似度,仅仅指字符重叠度

sudo apt-get install python-Levenshtein

 import Levenshtein as lst>>> lst.distance('as','asd')1>>> lst.ratio('as','asd')0.8>>> lst.ratio('ase','asd')0.6666666666666666>>> lst.distance('ase','asd')1>>> lst.distance('as','as')0>>> lst.distance('好的','好像')3>>> lst.ratio('好的','好像')0.5>>> lst.ratio('好的还可以','好像')0.47619047619047616>>> lst.ratio('好像是','好像')0.8>>> 
0 0