语意分析,比较单词相似度,英文单词切词法,combine组合数学算法是关键。
来源:互联网 发布:在淘宝怎么找商家套现 编辑:程序博客网 时间:2024/05/16 00:27
比较单词相似度,必须首先切词,英文单词切词法,combine排列组合的“组合”数学算法是关键。
下面代码给出原子的一种思路:比如输入单词“spide”,输出所有可能用来和其他单词比较的原子,由于单词长度是5,匹配度小于60%的没意义,所以原子最小长度是3。
代码是从C语言算法改过来的,同样代码也可以修改成任何编程语言。
ide
pde
sde
pie
sie
spe
pid
sid
spd
spi
pide
side
spde
spie
spid
spide
这里用到了Combine 输出全部组合,Combine 5,3就是得到在5个里选3个的全部可能选法。
<SCRIPT LANGUAGE="vbScript">
str="spide"
''创建全局字典对象,用来存储所有得到的原子结果
Set dict=CreateObject("Scripting.Dictionary")
Dim a(100)
strLength=Len(str)
''原子
atomyLength=round(strLength*0.6)
For x=atomyLength To strLength
a(0)=x
''计算5选3,5选4,5选5组合
combine strLength,x
next
sub combine(m, k)
''计算组合在m里面选k个元素的全部组合情况,添加到字典对象里
i=0
j=0
For i=m To k Step -1
a(k)=i
if (k>1) then
combine i-1,k-1
else
tempStr=""
for j=1 To a(0)
tempStr=tempStr & Mid(str,a(j),1)
Next
''排除重复的,加到字典里
If Not dict. Exists(tempStr) then dict.add tempStr,Len(tempStr)
End if
next
End sub
Main()
Sub Main
''输出显示结果
For i=0 To dict.count-1
Document.write dict.keys()(i) & "<br/>"
next
End sub
</SCRIPT>
- 语意分析,比较单词相似度,英文单词切词法,combine组合数学算法是关键。
- 相似英文单词搜索算法(C#)
- python 比较单词的相似度
- Levenshtein Distance算法java实现,英文单词相似度
- 组合数学-换方算法分析
- 比较两字符串相似度算法
- 用组合数学的方法证明相似
- 词法分析中的 贪心算法
- hdu 2082-组合数学-找单词
- 出个题目大家玩玩 : 比较14万单词的相似度
- C#实现字符串相似度比较[Levenshtein Distance算法].
- N-Gram 算法用来做相似度比较
- C#实现字符串相似度比较[Levenshtein Distance算法].
- C#实现字符串相似度比较[Levenshtein Distance算法]
- 哈希算法实现图像相似度比较(Python&OpenCV)
- JS比较相似度
- 图像相似度比较
- 图片相似度比较
- 我的博客生活
- 三种语言递归效率的比较matlab,python,c,lisp....
- oracle9i学习笔记,存储过程的建立及游标的用法!
- Cadence ICFB 5141/IUS58 数字、混合信号仿真
- 利用stringstream实现数据类型的转换。
- 语意分析,比较单词相似度,英文单词切词法,combine组合数学算法是关键。
- 人民币数字转汉字
- 优化一般思路/模式(一)
- 大家比较忽略的知识:Html网页页面head区规范知识
- 一个基于Mule的企业服务总线的案例
- 对于软件开发哲学的经验谈
- 谁是富人?2006年IT业薪酬报告出炉
- 浅谈 接口(Interface)的作用
- SubVersion基本概念与快速流程,做大项目必备