『悬浮系统』的交互方案探讨

来源:互联网 发布:sql utf8编码转换gbk 编辑:程序博客网 时间:2024/06/05 09:29

交互是一个伴随着生物出现就存在的概念,交互可以看成是一种传达信息的行为。交互有两个要素:发送信息者和接受信息者,或者称为输入和反馈。人与机器的交互就是人与机器打交道的方式。
从信息传递方向来看,交互可以分为单向交互和双向交互。人与人的交互就是双向交互,彼此在输入者和反馈者角色中变换,但可以确定的是同一时间只能有一个发送者和一个接收者(两个人交互的情况下),否则就是在吵架。而人与机器的交互,从目前来看都属于单向交互。
从交互者的数量来看,交互可以是一对多,也可以是多对一甚至是多对多,这对于人与人之间的交互来说是件极其容易的事,但是对于机器来说这就不是一件好玩的事了。在人与机器的交互中,多对多的交互不仅复杂难控,而且没有意义。多对一的交互也存在着许多问题。
首先机器是无法判断与它交互的人是谁的,也就是说一旦处于交互状态,机器无法知道是谁在和它玩耍。比如手机,一旦解锁,它是不知道正在触摸它的人是不是它的主人的。
其次有些情况下机器无法判断有多少人在与他交互,这一点不是无法做到,而是没必要。
此外,机器只能按顺序对交互做出反应,如果有人捣乱的话,它是无法做到不理捣蛋鬼的。就像你在跟一个朋友说话,有个疯子过来骚扰你的朋友,你的朋友肯定会继续和你交流而不理会疯子,但是机器又怎么知道谁是疯子,谁不是呢?也许在机器眼里,所有人都是疯子也未可知。
这样看来一对一的交互才是最安全保险的,而现在的交互模式也是按照一对一的交互模式设计的,但这不代表就消除了多对一的交互情况,因为机器是无法判断有几个人在和它交互的。


对于交互的发展,大致可以分为四个阶段:机械式交互,触摸交互,语音交互,动作交互。四个阶段也代表了四种人与机器的交互方式。
机械式交互是出现最早,使用最广,技术最成熟的交互方式。所有的按钮输入,包括开车挂档等等都可以归纳为机械式交互。
触摸交互随着屏幕技术的发展而出现,是目前电子产品的主流交互方式。这种交互技术目前已经相当成熟并且已经取代了相当一部分的机械式交互方式。这种交互方式继承了机械交互的精确性,同时把交互的范围扩大了百倍。
以上两种交互方式构成了目前人与机器的主要交互方式。它们的思考方式是交互的方式由机器说了算,让人去适应和习惯它们的交互方式。就像美国人很傲慢,其他国家要想和美国做生意就得先学会英语。
语音交互和动作交互在目前来看还不是很成熟,至少近几十年内还不能取代上面的两种主要交互方式。语音交互伴随着语音识别技术的发展而出现,动作交互当然也依赖于动作捕捉硬件的发展。这两种交互方式要想普及还有相当长的一段路要走,语音识别技术目前已越来越成熟,但是语义理解对于机器来说还是个让人头疼的问题。至于动作识别,现在都还差强人意。
但是你会发现,这两种交互方式的出现,彻底转换了交互的思维。语音和动作交互开始以人为主导,让机器去理解人的交互方式和习惯,如果有一天真的可以让机器理解人的语言和行为并进行交互,不得不说那将是一场革命。


在平面显示器上开发手势交互面临的难题。
首先是手势识别设备差强人意,存在许多识别误差。手势识别设备上的摄像机只能拍到面向它的那一面,对于另一面的情况,识别设别只能靠“猜测”来给出一个它认为可能的结果,而许多时候,这个猜测都是错误的。此外当两只手靠得太近时,设备就会忽略掉其中某一只手。另外一个就是抖动的问题,鼠标放在桌上,只要没人碰它,它就是不动的,但是当你把手停在空中,不管你如何用力控制,依然会轻微抖动,当然这也逃不过手势识别设备的法眼,但是它却不会管你心里是想动还是不想动,所以很明显这样的交互不适合帕金森患者和部分老年人。还有一个很严重的误操作的问题,几乎没有很自然的解决办法,因为看不透人心。
触摸交互和手势交互存在一个明显的区别。触摸交互是有交互实体的,那就是屏幕,我们可以精确的将手放到屏幕的任意一个坐标。但是对于手势交互,我们需要假象一个存在于空间中的虚拟屏幕,然而事实上我们却看不见它,不知道这块虚拟的交互平面有多宽,有多高,距离我们有多远。
另外一个区别就是显示与交互的分离。对于触摸屏来说,我看到的像素和我触摸到的地方是同一个地方,它们是重合的。但是手势交互不一样,交互和显示在两个分离的空间,用着两套不同的坐标系,要想精确交互几乎是不可能的。
此外,目前的手势交互依然沿用着触摸交互的习惯。触摸交互的交互空间其实是一个 12 的三维空间,如下图所示,因为你的手指无法穿透屏幕,除非你练过大力金刚指。
触摸交互空间
而对于手势交互的空间则是不折不扣的全三维空间,因为假象中的虚拟交互平面挡不住你的手,即使没练过任何武功也能毫不费力的穿透这个虚拟交互平面。
手势交互空间
这就是问题所在,你可以轻松的把手放到屏幕上,但是对于一个想象中的非常薄的平板,你又如何将手精确的放到上面呢?要么就是手指穿过交互平面,要么就是触及不到。在这要一个微小的距离内,人对于深度的感知是很不灵敏的。即使是三维的画面,由于触碰不到实体,也很难把握这个距离,更何况是浮在空中的一张薄薄的二维画面。而且利用欺骗人眼产生的三维画面也同样会在手势交互时影响大脑对深度的判断。
这种凭空的交互和雾屏不一样,雾屏虽然号称是在空气中显示,但实际上我们能清楚的看到水雾形成的屏幕,即使没有投射画面,依然清晰可见。广义上来说雾屏和LED、LCD屏没有本质区别,它们都有显示载体,有了载体,交互也就有了依托,虽然你的手也可以轻松穿过雾屏,但是你能看见雾屏所在的区域,并且你能够清晰的感觉到到你的手触摸到了雾屏,因此交互也就和传统触摸屏变得如出一辙,而实际上,雾屏的交互也的确沿用了触摸屏的交互套路。


我认为这种凭空的手势交互应该破旧立新,和传统的交互划清界限。
我们总是担心自己开发的手势交互符不符合多数人的操作习惯,其实这种担心是多余的。交互是一个不能独立存在的东西,它必须和产品结合在一起才有意义。当人类发明第一台电脑,第一部手机的时候,除了发明它们的人,其他人也没人会用,但是发明者却从不为它们发明的电脑或手机的交互好不好而担心。其实交互只是机器的附属品,人们会为一个功能强大的机器买单而从来不会为一套完美的交互模式买单。当人们需要使用机器的时候,自然会去习惯机器的交互方式,这一点毫无疑问。
前面我们说手势交互的思维是让机器去理解人的行为,但是目前这是不可能的,所以我们应该采用一种投机取巧的方式。既然机器无法理解人的行人,那么我们就规定一套标准的行为,告诉机器每个动作代表什么意思,并且只认规定以内的手势,其他的动作一律忽略。就像交警指挥交通,既然不能保证每个人都对同一个手势有相同的理解,也不能保证每一个交警用相同的手势表达同一个意思,那么就制定一套标准的交通指挥手势,大家都来学习这套手势,目前来看,这的确是最简单而且行之有效的办法。
鉴于手势识别设备自身的不完善,我们不得抛弃传统交互中的许多地方。比如点击操作不再适用,之所以一想到交互,点击操作就在我们脑海中挥之不去,完全是因为传统交互给我们戴上的精神枷锁,就像“紧箍咒”一样时刻让我们的手不自觉地想要点击,已经形成了一种根深蒂固的习惯。然而,如果我们所做的事业真的是一场革命的话,就必须打破枷锁。


对于交互手势的设计并不是一件让人愉快的事,既不能反人类,也不能过于生活化,还要简单易懂。易懂的意思不经要让使用的人易懂易学,还要让手势识别设备易懂。最重要的是不能有歧义和冲突,不能有歧义是对人而言,不能有冲突是对手势识别设别来说。
对于平面显示设备的交互手势,应该与触摸交互有所区别,甚至应该放弃老的那一套模式。我们可以从其中几个基本功能出发,考虑新的交互模式。
交互要实现的功能与交互的方式无关,在触摸或者鼠标的交互方式中,有几项基本的功能:

  • 点击
  • 拖动
  • 翻页

在手势交互系统中,我废弃了触摸交互中的那一套点击操作,并对基本的交互做出如下设计:

  • 张开手掌表示表示鼠标在正常状态,同时屏幕上显示一个张开的手的图标跟随手的移动。
  • 握拳表示选中,也就是按下鼠标左键的效果,同时鼠标变为握拳的小手。
  • 再次张开手表示点击,也就是鼠标双击的操作。
  • 握拳状态下移动手可以拖动可拖动的物件,包括翻页,模拟的是按下鼠标左键移动鼠标的效果,鼠标依然显示为握拳小手图标。
  • 翻页同样可以由手的上下左右移动实现,在没有歧义的情况下,可以有多种手势完成同一功能。翻页分为左右和上下,鼠标对应横竖两种手掌图标。
  • 缩放可以由两手的分开合拢实现,也可以通过单手的开合实现,同时鼠标变为45°角双箭头。

附加功能:

  • 通过顺时针画圈和逆时针画圈表示返回和前进。
  • 还有各种手势可以用在游戏中,视不同的游戏而不同,但这些都不属于正规手势了,就想游戏经常赋予W、A、S、D以前后左右移动的功能,但再Windows系统中,这四个键并不具备这样的特殊能力。

以上的交互基本上是按照鼠标操作的那一套沿用过来的,之所以没有用触摸屏的那一套,是因为目前按触摸屏的那一套来做手势交互是存在很多问题的,即使做出来也会难以使用。从交互设备出现的时间来看,也是鼠标先于触摸屏诞生的,鼠标发明于1968年,而在那三年之后触摸屏才诞生。而且鼠标交互和手势交互有着一个共同的特点,那就是显示空间与交互空间分离。所以沿用鼠标交互来思考手势交互的模式应该是一个明智之举。


真正的三维显示是在空间中制造真实的幻影,到那时我们的操作习惯将真正回归,我们会像生活中那样翻动书页,挪动物体。再也没有复杂的交互模式,一切交互来自对生活的理解,最好的交互就是没有交互。

原创粉丝点击