毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-TIMIT
来源:互联网 发布:博客打水软件 编辑:程序博客网 时间:2024/05/18 00:53
在自己搭建的wordpress小帐蓬里面发了点东西又混回CSDN来了。。
由于语音关键词检测需要的数据大都散布在多重文件夹之下,而为针对识别任务组织的文件结构对于关键词检出来讲,训练样本中的词频不同可能对不同词作模版的关键词检出效果产生影响~干脆来做一次词频统计。
开始总是希望用WINDOWS下的BAT文件或是LINUX的SHELL脚本作相关工作,然后。。。前者又丑又不熟悉,后者总是在学还不好上手做东西。直到在cnblog上发现了path的处理脚本,感谢原博客作者And类似脚本请参看编者发在公号上的东西:文章点这里
于是乎,开始在TIMIT师兄提取的关键词文件上写简单的脚本作词频统计:
首先,在存有TIMIT文件的文件夹下用dir > onename(windows)或者ls > onename(linux)将所有文件名输入onename文件。
上图可见关键词文件结构,然后,在onename文件的同目录下建立如下python脚本运行即可获取统计结果
<span style="font-size:14px;">f = open("onename")keywordContainer = {}s = f.readline().split('_')[0]while (s != ''): if (s == ' '): pass elif (keywordContainer.has_key(s)): keywordContainer[s] += 1 else: keywordContainer[s] = 1 s = f.readline().split('_')[0]print "There's " + str(len(keywordContainer)) + " keywords in Total";for k in keywordContainer.keys(): print k + ":" + str(keywordContainer[k]/2) + " times"</span>
0 0
- 毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-TIMIT
- 毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-Librispeech
- 毕业设计- 基于深度神经网络的语音关键词检出系统-上手currennt-1
- 论文-基于深度学习的语音关键词检出
- python统计词频的方法
- 使用python的map和reduce统计词频
- Python字典使用--词频统计的GUI实现
- 语音识别系统之kaldi----在timit上的实验
- Python使用Hadoop进行词频统计
- 使用Python+NLTK实现英文单词词频统计
- 使用Python+NLTK实现英文单词词频统计
- 基于LUCENE的java词频统计
- python--更干净的词频统计
- 基于Python和R语言的分词/词频统计/词云图
- python 统计词频
- python统计汉字词频
- python 统计词频
- python统计文档词频
- 简单html音乐播放器
- Android-Volley
- View的setWillNotDraw()
- 我自己研究开源项目源代码的两个重要习惯
- 湘潭大学oj1216
- 毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-TIMIT
- 2D基元绘图
- 个人制作网站全过程分享
- step1 writeup —— 输入作为函数参数
- 第三章第32题约瑟夫环问题
- 解析页面font相关的css
- vi编辑器的使用1
- 五子棋过程中用到的知识【flash as3 】
- VHDL上机练习:半加器(Active-HDL)