影片内容相似度计算关键点
来源:互联网 发布:专业处理淘宝盗图申诉 编辑:程序博客网 时间:2024/05/21 11:22
一:向量空间模型(VSM)
1.向量空间模型(VSM):是最常用的相似度计算模型。
2.基本思想:把每个特征词给看成一个维度,而词的权重看成其值(有向),即向量,这样每条媒资的特征词及其权重就构成了一个n维空间图。两个媒资的相似度就是两个空间图的接近度。相似度可用向量之间的夹角或距离来表示。
3.计算结果:在[0,1]范围内,余弦值越大,两个文本的相似度就越大。
4.余弦定理计算公式如下:
二:计算模型
1.计算各项元数据的相似度值;
2.根据各项元数据在整体计算中的重要性,决定其所占的权重比例值;
3.各项的元数据相似度值*各项所占的权重比例值,再进行累加,得出最终的相似度结果值;
三:倒排索引
倒排索引:是文档检索系统中最常用的数据结构,被广泛地应用于全文搜索引擎。它主要是用来存储某个单词或词组在一个文档或一组文件中的存储位置的映射,即提供了一种根据内容来查找文档的方式。由于不是根据文档来确定文档所包含的内容,而是进行相反的操作,因而称为倒排索引(InvertedIndex)。
0 0
- 影片内容相似度计算关键点
- libsvm 参数以及计算测试点相似度
- 浏览器关键时间点计算
- 计算图像相似度
- 计算字符串相似度
- 句子相似度计算
- 图像相似度计算
- 相似度计算
- 字符串相似度计算
- 图像相似度计算
- 图像相似度计算
- 文本相似度计算
- 相似度计算概述
- 图像相似度计算
- 相似度计算
- 计算相似度方法
- 舆情相似度计算
- 图像相似度计算
- 接上面极光推送提到的原生推送(APNS)
- Linux系统最大进程数和单进程最大线程数
- 获取SELinux TYPE
- Search in Rotated Sorted Array
- 傅立叶变换及频谱图
- 影片内容相似度计算关键点
- poj 1222 EXTENDED LIGHTS OUT(数学:高斯消元||爆搜:DFS)
- 从C++转C#
- To Be a Dog Man
- 系统文件hosts
- Name Eevrything
- IOS逆向[一].Hopper反汇编形态
- iOS --- NSURLRequest 和 NSURLConnection 的网络操作
- Android中几种定时任务的种实现方法