AT&T将于6月向开发者发布语音识别A…

来源：互联网发布：软件自做编辑：程序博客网时间：2024/05/22 21:39

AT&T的研究结构花费了20多年的时间来发展Watson语音和语音引擎，使其翻译成口语化。现在，AT&T正计划在6月份向开发者发布WatsonAPI，来加快语音识别的空间的发展和创新。而不必再去开发自己的语音识别软件，现在开发者可以把AT&T的WatsonAPI程序，以及语音识别功能更容易的插入到他们的应用程序。

AT&T将于6月向开发者发布语音识别API和SDK

AT&T的第一个API将集中在七个不同的领域：网路搜索、本地商业搜索，Q&A，语音邮件文本（voice mail totext），SMS，AT&T的U-verse视频节目指南和通用听写的API。AT&T公司发现，语音识别效果最好集中在特定的类别，这些类别有助于Watson了解期待什么类型的话。这个并不奇怪，例如，AT&T的信息视频（含下文）侧重建设Watson-enabled的U-verse节目指南。所以你可以告诉它你要找的频道，电影演员，或者其他你要找的。虽然这七类是最初的版本一部分，这听起来像是AT&T公司计划增加越来越多的类别。

另外，AT&T公司也发布了呼叫语音工具SDK，其允许开发者创建软件，记录所说的话，并通过翻译把它们发送到网络。最小的细节是在哪捕捉确切位置并发送，但是我们期望SDK发布的时候会听到更多，作为一种展示的Watson软件在API发布之前起了作用。AT&T最近推出了Android和iOS版的的翻译应用。它可以将你说的话翻译成另一种（所需要的）语言。但是在iTunes上有人发表评论表示，该应用听起来像是有bugs，仍然需要完善。

从历史上来看，AT&T使用Watson内部交互式语音应答之类的自动化客户服务系统。在过去的几年，我们已经了解，像voicemail-to-text，语音搜索，以及许多其他应用程序的交互式语音，或者通过一种应用程序把人类的声音转换到计算机上。同时这种应用体现了它的用武之地，我们很高兴看到Watson的技术能够为开发者所用。开发者可以将这些应用运用在各种环境中，而不仅仅是用来让一个接线员对着自动语音菜单大叫。

Update：AT&T公司表示，在纽约，最先进的一款QNX-equipped保时捷911就采用了这款应用。

AT&amp;T将于6月向开发者发布语音识别A…

AT&T将于6月向开发者发布语音识别A…