Opensmile 简介
来源:互联网 发布:热传导有限元软件 编辑:程序博客网 时间:2024/04/28 02:01
OpenSMILE软件简介
1. OpenSMILE软件介绍
openSMILE软件是一种以命令行形式运行的而不是图形界面的操作软件,通过配置config文件对音频进行特征提取。现在openSMILE 被世界上的研究学者和公司广泛应用。
openSMILE适用的领域有:speech recognition (feature extraction front-end, keyword spotting, etc.), the area of affective computing(情感计算) (emotion recognition, affect sensitive virtual agents, etc.), Music Information Retrieval_r(chord labeling(和弦标记), beat tracking)(节拍追踪), onset detection(起始点检测) etc.). With the 2.0 open-source release we target the wider multi-media community by including the popular openCV library for video processing and video feature extraction.
Figure.1 语音识别系统基本原理框图及openSMILE的应用
2. OpenSMILE软件的输入输出文件格式
Data input: openSMILE can read data from the following file formats
–
–
–
–
–
Data output: For writing data data to _les, the same formats as on the input side are supported, except for an additional binary matrix format:
–
–
–
–
–
–
3. OpenSMILE可以对数据进行以下四类的特征提取操作:
1)
–
–
–
–
–
–
–
–
2)
–
–
–
–
–
–
3)
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
4)
–
–
–
–
–
–
–
–
–
–
–
–
–
–
4. config文件格式和运行方式
1)
Figure.2 Overview on openSMILE's component types and openSMILE's basic architecture
Figure.3 Incremental processing with ring-buffers. Partially filled buffers (left) and filled
buffers with warped read/write pointers (right).
2) openSMILE执行方式
openSMILE软件是通过命令行形式运行提取音频特征的。命令行格式如下:
SMILExtract -C config/demo/demo1nenergy.conf -I wav_samples/speech01.wav -O speech01.energy.csv
其中,-C 说明提取特征的配置文件,-I 说明输入的数据源,-O 说明输出的特征文件,另,执行 SMILExtraction –h 命令,可以显示openSMILE软件所有使用信息并退出。
3) config文件示例
openSMILE软件的配置文件示例如下:
[ component Instances : cComponentManager ]< don't change this
; configure the default data memory :
instance [ dataMemory ] . type=cDataMemory
;configure an example data source(name = source1 ) :
instance [ source1 ] . type= cWaveSource
instance [frame ] . type= cFramer
instance[pe].type=cVectorPreemphasis
……
///////////////component configuration ////////////////////////////////////////
/////////////////////////////////////////////////////////////////////////////////////////////
; the following sections configure the components listed above
[ source1 : cWaveSource ]
; the following sets the level this component writes to
; the leval will be created by this component
; no other components may write to a level having the same name
writer . dmLevel = wave
filename = input .wav
[frame : cFramer ]
reader . dmLevel=wave
writer . dmLevel=frames
frameSize = 0.0250
frameStep = 0.010
[pe:cVectorPreemphasis]
reader.dmLevel=frames
writer.dmLevel=framespe
k = 0.97
de = 0
……
////////////////data output configuration //////////////////////
// ----- you might need to customize the arff output to suit your needs: ------
[arffsink:cArffSink]
reader.dmLevel= framespe
; do not print "frameIndex" attribute to ARFF file
frameIndex=0
frameTime=1
; name of output file as commandline option
filename=cm[arffout(O){output.arff}:name of WEKA Arff output file]
; name of @relation in the ARFF file
relation=cm[corpus{SMILEfeatures}:corpus name, arff relation]
; name of the current instance (usually file name of input wave file)
instanceName=cm[instname(N){noname}:name of arff instance]
;; name of class label
class[0].name = emotion
class[0].type = cm[classes{unknown}:all classes for arff file attribute]
target[0].all = cm[classlabel(a){unknown}:instance class label]
; append to an existing file, so multiple calls of SMILExtract on different
; input files append to the same output ARFF file append=1
通过以上简单的config文件示例,可以清楚的看到配置文件的书写方式,根据自己想要的音频特征修改配置文件可以提取相应的音频特征。其中,各类特征提取的参数可以根据的需要进行修改。
5. 延伸拓展
openSMILE软件是一个开源的数据库,所有的程序都是由C++语言编写,并且openSMILE软件可以适用于分析各种时序数据。只要根据自己的数据信息,可以修改openSMILE软件的源代码生成自己的.exe程序就可以用于处理相应数据。
openSMILE软件对于音频处理的特征提取是一款很有效的工具,我们可以借助工具找到自己的创新点,而不是仅仅局限于开发一个特征提取程序,有了这些有效工具的帮助我们可以很快的找到自己需要着重研究的点。在各个领域内,我们都要善于利用各种工具用于自己的开发研究,站在巨人的肩膀上开拓创新一定会比闭门造车更能收获成功。
注:更多关于openSMILE软件的信息,可以在官网http://openSMILE.sourceforge.net/下载openSMILE_book_2.0-rc1.pdf查阅。
openSMILE 开发站点:http://audeering.com/research/opensmile/
- Opensmile 简介
- OPENsmile
- opensmile使用指南
- OpenSMILE 提取音频特征
- openSMILE安装详细教程
- openSMILE安装教程
- openSMILE语音特征提取
- 《openSMILE 用户手册》 第一章
- 《openSMILE用户手册》第2章 (1) openSMILE安装
- 《openSMILE用户手册》第2章 (2) openSMILE 第一次特征提取
- 用opensmile批量提取语音特征
- openSmile-2.3.0在Linux下安装
- openSMILE批量提取语音文件 脚本
- openSmile-2.3.0批量提取mfcc参数
- 使用openSMILE提取MFCC简易教程(Mac)
- opensmile读取wav出错:bogus wave/riff header or file in wrong format解决办法
- 使用opensmile提取音频的特征,得到特征向量,并扔进libsvm中进行分类训练测试
- 《openSMILE用户手册》第2章 (3) 默认特征集的使用
- discuz手机浏览切换到电脑版后无法再切换到手机版,原理分析
- 大数据_Storm_Storm消息机制_消息的可靠性
- linux配置yum源
- iOS post请求上传文件(OC)
- ZZULIOJ 1905: 小火山的跳子游戏
- Opensmile 简介
- leetcode:sqrtx
- HDU 2036 叉积计算
- 测试东西的博客
- 树结构练习——排序二叉树的中序遍历
- 最高分是多少
- javascript取对象方法的封装
- Android Stdio--------编译错误之appcompat
- POJ 1011 Sticks