人机交互遐想——能否考虑给计算机提供一个会说话的嘴巴?

来源:互联网 发布:linux snmp 安装包 编辑:程序博客网 时间:2024/04/28 04:06

在Windows或者在Linux平台,计算机都可以“开口”说话,例如让它播放美妙的音乐。但Windows或Linux 操作系统本身却不会用声音来表达自己。比如,现在系统很繁忙,那么操作系统都是通过将鼠标指针形状变成沙型漏斗来告诉用户,现在系统很繁忙,而不会通过Speaker发出,诸如,“我很忙,请稍后”等声音来告知用户。

我想,要实现这么一个功能应该不会很困难,但好像也很困难。

从程序设计角度来看,做到用声音来传达系统状态好像并不难实现。

但从系统运行管理或系统设计的角度来说却会有一些困难。我们现在的系统繁忙的状态大概都定义为:除了忙于处理当前的事情之外,再也无法作其他事情了。如果系统能够有空闲时间来控制Speaker来发出声音的话,那就说明它不算很忙。所以,要它在忙的时候,发出声音,其实是不现实,也很难做到。

或许造成这个的原因就是,我们现在使用的平台在其核心本身的设计上,它就是不会说话的,它说话都是通过其他辅助工具(声卡和Speaker)来实现。平台核心好像是一个“哑人”,而会发声的系统,就好像我们给这个“哑人”配了个会说话的“代理人”,“哑人”要说什么,就通过某种方式告诉这个“代理人”。也就是说,这个“代理人”是个非常被动的人,一定要“哑人”详细地告诉他要说什么,怎么说之后,“代理人”才会说话。但是当这个“哑人”忙到没空告诉这个“代理人”要说什么的时候,那么这个哑人也就没有办法说话了,而就这种情况就相当于我们系统繁忙时的状态。。

那么,能否考虑在硬件结构中增加一个专门帮系统说话的部件呢?当系统繁忙,比如CPU非常繁忙时,就让这个部件向用户传达声音信息。当然要求这个部件不占有或占很少的CPU资源。这时,这个部件就相当于“哑人”的“代理人”,而且他是个具有一定主动性的“代理人”,他除了传达“哑人”要说的话之外,还可以报告“哑人”的状态。

在语音识别技术越来越成熟的今天,获取语音交互会成为人机交互很重要的一环。那么如果可以实现上述的这种语音交互,我想或许会大大提高计算机的易用性,显得更具人性化。。

原创粉丝点击