keras.preprocessing.text 源码小bug

来源:互联网 发布:知峰竹纤维 编辑:程序博客网 时间:2024/05/16 08:15

keras1.2.0版本

keras.preprocessing.text.py源码有一点小问题。

如图:

词索引从1开始(0是保留索引,不指向任何词),这里从序列生成矩阵的时候,不应该写到第j列,而应该是第j-1列,因为矩阵下标是从0开始的。所以应该将四个X[i][j]全部改为X[i][j-1]。否则生成的矩阵第一列将全是0。这样以后,还不完美。因为这样矩阵的最后一列全是0,没有有效信息。原因可想而知,前边过滤词的时候肯定用的>=而不是>,所以更改以下部分(全部去掉等于号即可):



不知道最新的keras2.0有没有更改过来,这是我目前发现的keras源码的第二个错误的地方了。第一个我的另一篇博客中也有写。

不过瑕不掩瑜,keras是一个很好的工具。


0 0
原创粉丝点击