【分享】109小时外国人说中文录音数据(样例)
来源:互联网 发布:数据库安全审计 编辑:程序博客网 时间:2024/05/17 08:57
数据介绍
总计约109小时的老外说中文语音数据。
覆盖了英国、美国、法国、意大利、以色列、哥伦比亚、法国等国的人(从邮件后缀的国家统计估计有100多,但准确国家数目无法确知),共1097个发音人。
朗读内容包括的是日常用于外国人的朗读语料,共130767条,其中,字:56874,词:65940,句子:7953。
本数据为该数据的样例数据。
数据格式
audio/为语音数据目录,每个目录下有10~300条音频,格式为16k,16bit,wav数据。
mapping为音频对应朗读文本,包含文件名,汉字和对应的拼音,拼音之间用“-”分隔分,1、2、3、4、0分别代表1声、2声、3声、4声和轻声。
数据样例
数据下载:http://www.datatang.com/data/45887
数据堂-数据共享服务平台
0 0
- 【分享】109小时外国人说中文录音数据(样例)
- 无锡外国人学中文
- 【分享】20000篇中文事件标注数据(样例)
- 别老让外国人拿咱国人说事。。。
- 关于特斯拉命案,外国人这样说
- 【4月限时免费】车载环境中文手机录音数据
- 2014年外国人中文十级考试题
- 她说她女儿(JAVASCRIPT小时的玩伴,也姓杨)
- 如何学习外国人的思维方式说英语
- 2 小时玩转 iptables 讲义企业版 v1.5.4(PDF + ISO + 录音)
- 分享一个外国人写的微处理器设计书
- 大数据,小时代,向移动互联网迁徙--DCCI2012上半年中国移动互联网数据分享
- 《大数据,小时代,向移动互联网迁徙-2012上半年移动互联网数据分享》_DCCI
- 【分享】WFW录音软件源代码
- CC2530开发中文应用笔记,中文数据手册分享
- 分享一个可以获取7天24小时的天气预报API,包含PM2.5等数据
- 外国人申请居留许可服务指南(中英文)
- 大陆--身份证(外国人)正则表达式
- eclipse failed to create the java virtual machine
- 使用OMF管理联机重做日志文件
- 正则表达式一
- delphi2010 string、ansistring及Tbytes之间的转换
- IOS中NSUserDefaults的用法(轻量级本地数据存储)
- 【分享】109小时外国人说中文录音数据(样例)
- WebM 媒体格式
- itunes在审核期重新上传程序包
- 用phpMailer发送邮件
- 手动 1- linux 安装mysql5.6
- MX记录
- 获知自己所在的DNS服务器(windows下)
- GridView行,指向时变色
- 享元模式