深度学习输入符号编码

来源:互联网 发布:linux gcc rpm安装包 编辑:程序博客网 时间:2024/06/10 10:41



对于一些符号数据,比如用户ID、字词等。可以通过通过以下方法进行编码。
step 1). one-host编码。
step 2). multi-hot编码。因为符号数据的one-hot是非常稀疏的,维度非常大,不利于训练。因此要用six-hot类似的编码,或是挂靠编码。
step 3). nn编码。即使是six-hot,维度也是非常大的, 通过神经网络来进行编码学习embedding,比如稀疏层, 即只有hot的地方采用连接。

原创粉丝点击