基于稀疏矩阵数据结构的相关人物搜索

来源:互联网 发布:excel 排版制作软件 编辑:程序博客网 时间:2024/05/24 07:19

实体的词向量是利用word2vec训练得到的,每个实体的词向量长度为100,训练得到的结果见附件vertexName-vec.txt

开始采用的是HashMap结构进行存储,但出现OOM等一些问题,就拿稀疏矩阵来尝试下,效果不错,嗖嗖嗖

稀疏矩阵构建及查询:

稀疏矩阵结构:


三元组在矩阵中具体位置结构:

三元组结构体:
 

搜索结果:

请输入检索节点:
毛泽东
想要得到的TopN:
10
叶剑英#DIV#0.8786766021887125
华国锋#DIV#0.8691403116586236
邓小平#DIV#0.8560495212960941
陈毅#DIV#0.8417411983853618
萧劲光#DIV#0.8167936577713354
徐海东#DIV#0.7978155750998943
张春桥#DIV#0.7965857537574821
陈赓#DIV#0.7885015060295482
李克农#DIV#0.7820805260018616
毛远新#DIV#0.773292512123925

0 0