Reasoning With Neural Tensor Networks for Knowledge Base Completion
来源:互联网 发布:网络信息安全检测 编辑:程序博客网 时间:2024/06/09 16:09
[ 论文阅读地址 ]
1. 问题描述
输入
一个三元组:
输出
三元组
2. 模型
输出
打分函数:
其中:
uTR 是属于类别R的权值。f 是tanh激活函数,对输入的每个元素单独做tanh激活,即f:Rn→Rn 。e1 和e2 是输入的实体的向量表示,最初是直接赋随机值,训练时会更新。e1∈Rd×1 文章后文中提到了两点改进:- 不是每个输入实体对应一个向量,而是每个词语对应一个向量,实体向量由词向量求均值得到(作者提到,他们也采用了RNN进行实体向量的学习,但是由于数据中90%的实体都是由不超过两个词语构成,因而RNN并没有比简单的取平均更好)。同时在网络训练时候,也会对词向量进行更新。
- 对于词向量,采用已经训练好的词向量去作为初始化值会比随机初始化效果更好。
W[1:k]R 为和类别R 有关的张量,W[1:k]R∈Rd×d×k 。eT1W[1:k]Re2 可以看成⎡⎣⎢⎢eT1W1Re2⋮eT1WkRe2⎤⎦⎥⎥ ,即eT1W[1:k]Re2∈Rk 。VR 是和类别有关的权值,VR∈Rk×2d 。bR 是和类别有关的偏置,bR∈Rk 。
训练目标
正样本
损失函数
其中:
Ω=u,W,V,b,E N 是训练数据中三元组的个数。C 是构建负样本数据时,对每个正样本数据的采样次数。对于每个正样本T(i)=(e(i)1,R(i),e(i)2) ,生成的C 个负样本形如T(i)c=(e(i)1,R(i),ec) ,ec 是对样本中所有能出现在这个位置的实体进行随机重点内容采样而得到的。- 样本中不同的关系数量记为
NR ,R(i) 表示这其中的第i个关系。每个关系R(i) 都有自己独立的张量网络参数。 g 是上文中提到的打分函数即网络的输出结果。λ 是L2 正则化项的超参数权重。
目标函数求解
其中
3. 个人理解
最开始看到这个网络的时候,还在想那个双线性
令
那么
这一步转化很关键,因为把参数和输入进行了拆分。这样操作带来的好处就是,原目标函数可以进行等价变化:
其中:
S[1:k]TR∈Rk×d2 ,且每个关系R都有自己的S
化简到这里,就可以看出来,论文中提到的双线性:
eT1W[1:k]Re2
这一部分,其实实质是在网络的输入中,加入了额外的信息:
现在通用的神经元模型的计算模型是,给定输入
原本的神经网络利用的都是输入的一次信息(个人理解),而这个网络利用到了输入的二次信息。
1 0
- Reasoning With Neural Tensor Networks for Knowledge Base Completion
- Reasoning with Memory Augmented Neural Networks for Language Comprehension
- Question Answering over Knowledge Base with Neural Attention Combining Global Knowledge Information
- 论文解读Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks
- Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks 阅读笔记
- 论文笔记之Label-Free Supervision of Neural Networks with Physics and Domain Knowledge
- Vehicle Control with Neural Networks
- Convolutional Neural Networks for Speech
- Neural Networks for Machine Learning
- TimeMachine_Timeline Generation for Knowledge-Base Entities
- Learning Entity and Relation Embeddings for Knowledge Graph Completion
- An End-to-End System for Unconstrained Face Verification with Deep Convolutional Neural Networks
- T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos
- A new boosting algorithm for improved time-series forecasting with recurrent neural networks
- base knowledge
- knowledge base, knowledge graph
- ImageNet Classification with deep convolutional neural networks
- ImageNet Classification with Deep Convolutional neural Networks
- DES加密和解密
- Object.keys()应用
- 1027. Colors in Mars (20)
- 微信商户发红包和获取用户信息
- Java IO - Data
- Reasoning With Neural Tensor Networks for Knowledge Base Completion
- html 显示本地图像
- 关于Tomcat使用过程的小问题
- Eclipse导入lombok
- 单点登录没跳转到登录页面
- ios 真机调试涉及要点 应用程序发布要点及扼要流程
- sed 的使用
- 直播相关知识收集
- Linux下Openssl的安装