人机交互遐想——能否考虑给计算机提供一个会说话的嘴巴？

来源：互联网发布：linux snmp 安装包编辑：程序博客网时间：2024/04/28 04:06

在Windows或者在Linux平台，计算机都可以“开口”说话，例如让它播放美妙的音乐。但Windows或Linux 操作系统本身却不会用声音来表达自己。比如，现在系统很繁忙，那么操作系统都是通过将鼠标指针形状变成沙型漏斗来告诉用户，现在系统很繁忙，而不会通过Speaker发出，诸如，“我很忙，请稍后”等声音来告知用户。

我想，要实现这么一个功能应该不会很困难，但好像也很困难。

从程序设计角度来看，做到用声音来传达系统状态好像并不难实现。

但从系统运行管理或系统设计的角度来说却会有一些困难。我们现在的系统繁忙的状态大概都定义为：除了忙于处理当前的事情之外，再也无法作其他事情了。如果系统能够有空闲时间来控制Speaker来发出声音的话，那就说明它不算很忙。所以，要它在忙的时候，发出声音，其实是不现实，也很难做到。

或许造成这个的原因就是，我们现在使用的平台在其核心本身的设计上，它就是不会说话的，它说话都是通过其他辅助工具（声卡和Speaker）来实现。平台核心好像是一个“哑人”，而会发声的系统，就好像我们给这个“哑人”配了个会说话的“代理人”，“哑人”要说什么，就通过某种方式告诉这个“代理人”。也就是说，这个“代理人”是个非常被动的人，一定要“哑人”详细地告诉他要说什么，怎么说之后，“代理人”才会说话。但是当这个“哑人”忙到没空告诉这个“代理人”要说什么的时候，那么这个哑人也就没有办法说话了，而就这种情况就相当于我们系统繁忙时的状态。。

那么，能否考虑在硬件结构中增加一个专门帮系统说话的部件呢？当系统繁忙，比如CPU非常繁忙时，就让这个部件向用户传达声音信息。当然要求这个部件不占有或占很少的CPU资源。这时，这个部件就相当于“哑人”的“代理人”，而且他是个具有一定主动性的“代理人”，他除了传达“哑人”要说的话之外，还可以报告“哑人”的状态。

在语音识别技术越来越成熟的今天，获取语音交互会成为人机交互很重要的一环。那么如果可以实现上述的这种语音交互，我想或许会大大提高计算机的易用性，显得更具人性化。。