TextCNN
来源:互联网 发布:php中的错误类型有哪些 编辑:程序博客网 时间:2024/05/20 10:21
首先导入了tensorflow与numpy包,然后代码主要是建立一个可复用的TextCNN类,类的初始化参数
sequence_length:CNN需要固定输入与输出,所以每个句子的输入都是定长*词向量长度,定长一般设为最大句子长度,如果输入的句子词数没到定长就补充零,补充的零对后面的结果没有影响,因为后面的max-pooling只会输出最大值,补零的项会被过滤掉
num_classes:输出的文本类别总数也就是文本中有几个类别
vocab_size:字典大小,在之前的文本预处理阶段需要对文本进行分词与对单词进行编号,在训练的时候也是输入单词的id然后再词向量化,字典大小用通俗的话来说就是文本中出现了多少个词
embedding_size:嵌入长度,指的是词向量长度也就是用一个多大维的向量来表示词语,一般来说根据文本的规模定词向量的维度大小,样本数太少时使用较大维的词向量会造成难以收敛与容易过拟合的问题,有的TextCNN在这里会有一些区别,有的会采用固定的word2vec、fasttext、glove预先训练好的词向量
filter_sizes:卷积核大小的List,TextCNN里面的卷积和大小其实对应了传统NLP的n元语法的概念,这里的卷积核都是filter_size*embedding_size,其实就是filter_size个词作为一个整体来考虑,也可以理解为中文中有的词是一个字有的词是两个字,在不同卷积核的情况下对应数量字数的词会表现出更好的效果
num_filters:每个卷积核大小对应的卷积核个数,这里为了偷了一点懒,将不同大小卷积核的数量都设为一个常量
l2_reg_lambda:这个就是L2正则的权值,就不多解释了
阅读全文
0 0
- TextCNN
- textcnn自己的理解
- Tensorflow版TextCNN主要代码解析
- Tensorflow版TextCNN主要代码解析
- 用Tensorflow实现CNN文本分类(详细解释及TextCNN代码解释)
- Yoon Kim的textCNN讲解,以及tensorflow实现,CNN文本分类
- textCNN在tensorflow上的故事——记一个tf入门者的学习之路
- fastText、TextCNN、TextRNN……这里有一套NLP文本分类深度学习方法库供你选择 作者:机器人圈 / 微信号:ROBO_AI发表时间 :2017-07-28 图:pixabay
- XSL语言
- Maven项目pom.xml文件报xxx\target\classes\META-INF\MANIFEST.MF (系统找不到指定的路径)问题
- gem install报错ERROR: While executing gem ... (Gem::RemoteFetcher::FetchError) Errno::ECONNRESET:
- D
- 怎样从0开始搭建一个测试框架_6——PageObject
- TextCNN
- 【DL--13】CNN 两大特性(局部连接、权重共享)
- 【KMP next树】51nod 1277 字符串中的最大值
- Struts2学习笔记(五)——result结果类型
- OpenSSL生成自签名证书
- kubernetes学习记录(4)——创建kubernetes覆盖网络
- http 请求工具
- C# 程序员最常犯的 10 个错误 【已翻译100%】 英文原文:Top 10 Mistakes that C# Programmers Make 标签: C# oschina 推荐于 3年前 (共
- MIMO技术杂谈(一):鱼与熊掌能否兼得?--浅谈分集与复用的权衡