AT&T将于6月向开发者发布语音识别A…

来源:互联网 发布:软件自做 编辑:程序博客网 时间:2024/05/22 21:39

   AT&T的研究结构花费了20多年的时间来发展Watson语音和语音引擎,使其翻译成口语化。现在,AT&T正计划在6月份向开发者发布WatsonAPI,来加快语音识别的空间的发展和创新。而不必再去开发自己的语音识别软件,现在开发者可以把AT&T的WatsonAPI程序,以及语音识别功能更容易的插入到他们的应用程序。

AT&T将于6月向开发者发布语音识别API和SDK

   AT&T的第一个API将集中在七个不同的领域:网路搜索、本地商业搜索,Q&A,语音邮件文本(voice mail totext),SMS,AT&T的U-verse视频节目指南和通用听写的API。AT&T公司发现,语音识别效果最好集中在特定的类别,这些类别有助于Watson了解期待什么类型的话。这个并不奇怪,例如,AT&T的信息视频(含下文)侧重建设Watson-enabled的U-verse节目指南。所以你可以告诉它你要找的频道,电影演员,或者其他你要找的。虽然这七类是最初的版本一部分,这听起来像是AT&T公司计划增加越来越多的类别。

   另外,AT&T公司也发布了呼叫语音工具SDK,其允许开发者创建软件,记录所说的话,并通过翻译把它们发送到网络。最小的细节是在哪捕捉确切位置并发送,但是我们期望SDK发布的时候会听到更多,作为一种展示的Watson软件在API发布之前起了作用。AT&T最近推出了Android和iOS版的的翻译应用。它可以将你说的话翻译成另一种(所需要的)语言。但是在iTunes上有人发表评论表示,该应用听起来像是有bugs,仍然需要完善。

   从历史上来看,AT&T使用Watson内部交互式语音应答之类的自动化客户服务系统。在过去的几年,我们已经了解,像voicemail-to-text,语音搜索,以及许多其他应用程序的交互式语音,或者通过一种应用程序把人类的声音转换到计算机上。同时这种应用体现了它的用武之地,我们很高兴看到Watson的技术能够为开发者所用。开发者可以将这些应用运用在各种环境中,而不仅仅是用来让一个接线员对着自动语音菜单大叫。

   Update:AT&T公司表示,在纽约,最先进的一款QNX-equipped保时捷911就采用了这款应用。

原创粉丝点击