语音合成vocoder(二) 基频参数
来源:互联网 发布:sas软件 编辑:程序博客网 时间:2024/05/22 09:04
基本概念
声带每开启和关闭一次的时间就是基音周期(pitch period),倒数即为音频频率(pitch frequency)[1]。
基音频率取决于声带的大小、厚薄、松紧程度,以及声门上下之间的气压差的效应等。最低可达80Hz,最高可达500Hz,老年男性偏低,小孩女性偏高。它反映了声调的变化。
常用方法
常用的有自相关方法和倒谱方法
Autocorrelation Function(ACF)运算可以用于寻找周期信号的周期。因为周期信号的自相关函数也是周期信号,而且周期一致。比如YIN算法[2]就是使用的自相关方法。
W表示相关函数的窗口,
DIO
World里面使用DIO[3][4]提取pitch,相比之前的方法速度更快。主要分为三步:
1. 使用不同截止频率的低通滤波器进行滤波
如果滤波后的信号只包含一个周期
2. 计算F0候选以及置信度
取四个周期,计算每个周期的zero-crossing/peak/dip intervals应该一致,以此为标准计算置信度。
3. 选取置信度最高的频率作为最后的pitch
Harvest
参考文献
[1].《语音信号处理》 韩纪庆等 P15
[2].YIN, a fundamental frequency estimator for speech and music
[3].WORLD: a vocoder-based high-quality speech synthesis system for real-time applications
[4].Fast and Reliable F0 Estimation Method Based on the Period Extraction of Vocal Fold Vibration of Singing Voice and Speech
- 语音合成vocoder(二) 基频参数
- 语音合成vocoder(四) aperiodicity参数
- 语音合成vocoder(三) spectral envelope参数
- 语音合成vocoder(一) 概况
- 语音合成vocoder(五) synthesis
- 讯飞云语音-语音合成常用参数配置
- Android开发之语音合成及听写(二)
- [转]中英文语音合成与中文语音识别技术在c#中的应用(二)
- 科大讯飞(语音合成和语音听写)
- 灵云TTS(语音合成)
- 在vista下使用语音合成,语音识别体会(二)
- 语音合成
- 语音合成
- 语音合成
- 语音合成
- 语音合成
- 语音合成
- [语音合成技术第三讲]C# 中使用语音合成技术(二)
- 解决小米手机Android Studio安装app 报错的问题It is possible that this issue is resolved by uninstalling an existi
- javamail发送邮件《带附件》
- 05-树8 File Transfer (25分)
- struts2 OGNL (4)
- 站点登录功能的实现
- 语音合成vocoder(二) 基频参数
- 在JavaScript中判断键盘的大写锁定键(Caps Lock)是否打开(附扫描枪相关规则)
- sublime Text安装nodejs插件遇到问题
- X
- [一起学Hive]之五-Hive的视图和分区
- List接口
- struts2 标签(5)
- php curl模拟https请求
- linux搭建django运行环境