VAD实现 (二) --- 数据预处理
来源:互联网 发布:超图软件待遇 编辑:程序博客网 时间:2024/06/05 16:08
在用VAD算法确定静音和语音数据的开始和起止点之前,需要对语音数据进行处理,然后再计算语音数据的开始和起止点,这个过程称为数据的预处理,有些VAD算法是基于短时能量和过零率实现的,并不进行预处理操作,但实验表明,对数据进行预处理之后的效果要比不进行预处理的效果好。这里,对数据进行去除直流和加窗两个预处理。
一,去除直流
至少有这几个理由,要求我们去除直流。
- 直流,是频域的慢变成分,一般都是因为信号采集过程中仪器所致。
- 如果需要进行频谱分析,那么因为直流的频谱泄漏,会严重影响低频谱的分析。
- 直流一般不随时间变化,不反应信号的趋性。
去除直接代码如下:
float new_last_data ,last_data ; // 上次计算的去除直流之后和之前的值。float *remove_dc(short *data,int frame_size){float in0 =0.0 ,of0 = 0.0 ;float *tf = new float[frame_size];for (int i=0; i < frame_size; i++){tf[i] = in0 = (float)(data[i]);tf[i] = in0 - last_data + 0.9997 * new_last_data; // 这里所采用的去除直流公式:s_new(n) = s_old(n)-s_old(n-1)+0.9997*s_new(n-1)last_data = in0;new_last_data = of0 = tf[i];}return tf;}
加窗的作用就更明显了,见 语音信号的加窗处理
float *hamming(short *data,int frame_size){float *tf = new float[frame_size];float a = 6.28318530717959 / (frame_size - 1); // 2 * PI = 6.28318530717959for (int i=0; i< frame_size;i++){tf[i] = (float)(data[i]);tf[i] *= (0.54 - 0.46 * cos(a*i)); //ω(n) =0.54-0.46cos[2πn/(N-1)]}return tf;}
- VAD实现 (二) --- 数据预处理
- VAD实现 (一) --- 读取语音数据
- VAD实现 (一) --- 读取语音数据
- VAD实现 (三) --- 算法计算流程与框架
- 数据预处理系列:(二)创建试验样本数据
- VAD(静音抑制)
- VAD
- Sklearn学习(二)——数据预处理(Normalization)
- <转>Spark MLlib 数据预处理-特征变换(二)
- 数据预处理的python实现
- 端点检测(VAD)技术
- 数据预处理(2)
- sklearn学习记录二:数据预处理
- (二)机器学习笔记之数据预处理
- 体积阴影GPU实现--数据预处理
- python实现数据预处理之箱光滑
- 1、数据预处理(1)
- 图像数据预处理(上)
- 【无线路由器加密 预防邻居盗网】
- 23种设计模式(11):责任连模式
- sharepoint 2010 应用程序试图执行安全策略不允许的操作。要授予此应用程序所需的权限,请与系统管理员联系,或在配置文件中更改该应用程序的信任级别。
- insert语句
- 第二章 IoC 三种实例化Bean的方式
- VAD实现 (二) --- 数据预处理
- c++含有成员函数得类
- 链表中倒数第k个结点
- 块设备驱动实战高级篇二(在内核块设备中运用进程)
- 16-3 例13.2 运行
- 23种设计模式(12):策略模式
- HDU 1079 - Calendar Game
- 23种设计模式(13):迭代器模式
- java.net.SocketException四大异常解决方案