语音识别学习笔记(一)【概述】
来源:互联网 发布:淘宝买iphone7推荐店铺 编辑:程序博客网 时间:2024/04/28 19:13
- 概述:
1)语音识别是机器通过识别和理解过程把人类的语音信号转变成相应的文本或命令的技术。
2)集 声学、语音学、计算机、信息处理、人工智能等于一身的综合技术。 - 难点:
1)语音特征随与之相连的语音的不同而产生很大变化,且连续语音中各单位之间无明显边界;
2)语音特征随发音人生理和心理状态的变化而产生很大差异;
3)环境噪声和传输设备的差异也将影响特征的提取;
4)语义理解带来的困难,如语句表达的意思和上下文,文化背景等相关。 分类:
(1)识别:说话人识别和语音识别
(2)说话人识别:
1)从识别技术看:文本无关和文本相关;
2)从用途看:说话人辨认和说话人确认。
(3)语音识别:
1)按词汇量大小:小词汇量(10~100个)、中词汇量(100~500个)和大词汇量(500以上);
2)按发音方式:孤立词识别、连接词识别、连续语音识别和关键词检出;
孤立词识别:
连接词识别:
连续语音识别:
关键词检出:
3)按说话人:特定说话人和非特定说话人。
4)按语音识别方法:模板匹配法、随机模型法和概率语法分析法。识别过程:
0 0
- 语音识别学习笔记(一)【概述】
- Kaldi语音识别学习笔记(一)
- 百度语音识别学习(一)
- (三)语音识别概述
- 语音识别学习笔记汇总
- 基于HTK的连续语音识别系统搭建学习笔记(一)
- 基于HTK的连续语音识别系统搭建学习笔记(一)
- 语音识别发展概述
- 语音识别概述
- Sphinx语音识别学习记录 (一)-基本运行测试
- 语音识别技术学习系列(一)——入门
- Hark语音识别学习(一)-Hark desinger的使用
- 【OpenCV学习笔记】【教程翻译】一(基于SVM和神经网络的车牌识别概述)
- 语音识别的技术路线学习笔记
- 【神经网络学习笔记】语音识别-matlab语音信号预处理
- 语音识别学习笔记(二)【基于矢量量化的识别技术】
- 语音识别学习笔记(三)【动态时间归正的识别技术】
- ASR---自动语音识别 概述
- 图论算法---- 一笔画问题(欧拉路)
- 82. 83.Remove Duplicates from Sorted List II
- 用JS获取地址栏参数的方法(超级简单)
- CTU Open 1999 Lloyd Fifteen Puzzle
- 什么是IP地址
- 语音识别学习笔记(一)【概述】
- Mongodb初探
- 重写和重载区别
- shell 下执行mysql 命令
- 符号-分节4(逻辑运算符,位运算及左右移位运算)
- Android开发之——子线程中使用Toast或者更新UI
- 停止异常状态的集群
- Session
- Spring中bean的五种作用域