基于用户行为数据进行持续的产品创新

来源：互联网发布：中国的宏观经济数据编辑：程序博客网时间：2024/04/29 04:20

James Surowiecki是《群体的智慧》一书的作者。他在《纽约客》杂志的一个栏目里提到了“复杂性与用户选择之间的矛盾”：

有三位市场专业学者最近发表了一份研究报告，他们发现：当给予消费者某个数字设备的三款复杂度不一的型号时，超过60%的人选择了功能最多的那款。然后，当他们被赋予机会去从25个功能里选出一些来定制他们的产品时，他们表现得像置身于糖果店的小孩一样。（平均而言，他们每人选了20个。）但是，当他们被要求使用这个数字设备时，传说中的“功能疲劳症”便发作了。他们因为自己创造出来的过多选项而困扰不已，以致于他们最后承认：如果能使用简单一点的产品，他们会更开心。

当你在开发一个怪物似的产品时，你是意识不到的——直到有一天你去尝试使用它，你才恍然大悟。我把它称之为吃自助餐时的“食量”问题。当你非常饥饿的时候，看到面前这么多美味的食物可供选择，你很自然地会把自己的盘子装得满满的。但当坐到位置上时，你这才意识到，你绝不可能吃掉所有的食物。

平心而论，有时候人们确实需要复杂。谷歌的韩国首页就被故意设计得有点复杂。谷歌的Marissa Mayer解释道，“在我们一贯追求的简约主义不适用的场合，我们会灵活应变——这么做是很重要的！”

这在DonaldNorman早些时候的一篇博客中得到了印证。他说，韩国人在奢侈品消费方面钟情于复杂的东西：

最近，我在韩国的一家百货商店逛了一逛。每当我到访一个以前从未去过的国家，我总把逛百货商店和当地市场作为最好的消遣之一；这样我就能更好地了解当地的文化。食物不一样，服饰不一样；在过去，器具也不一样：家电、厨房用具、园艺工具、购物工具等等。

我发现，传统的“白色家电”（冰箱和洗衣机）是最有趣的。毫无疑问，商店里有韩国当地的品牌，比如LG和三星，但也有像通用电气、博朗、飞利浦这样的国际品牌。在规格和价格一样的前提下，韩国当地的产品看起来都比外来品牌的产品更加复杂。为什么呢？我问了两位“导游”——他们都是可用性方面的专家。他们的解释是，“因为韩国人喜欢让东西看起来复杂一点。”那是一种象征，表明了他们的身份。

James Surowiecki引用的研究报告，恰恰说明了人们口头表达的欲望与他们内心真正的所欲之物之间的差别。你会发现，这个问题在可用性范畴里一次又一次地被反应出来：用户口述的他们想做的事情，与他们实际的所作所为相比，往往天差地别。从可用性的角度讲，询问用户他们想要什么几乎是徒劳的，原因就在这里——你必须观察他们真正做了些什么。这就是“可用性测试”。与其询问用户他们想要数码相机的什么功能，正确的做法应该是：把几个数码相机的原型摆在他们面前，然后观察他们是怎么使用的。用户摆弄原型机的过程中传递出来的信息（成功也好，失败也罢），比1000份问卷调查或小组讨论的产出更有价值。遗憾的是，制作数码相机原型的费用过于昂贵，因此也没人真的这么做。

然而，制作软件的原型（纯粹是脑力劳动的产物），相比之下要容易得多。Dare Obasanjo最近提到了一篇很棒的文章，标题为“Practical Guide to Controlled Experiments on the Web”（网上可控实验的实用指南），为基于观察的A/B测试进行了有力的辩护：

亚马逊公司的Greg Linden创建了一个原型，展示了基于购物车里的商品进行个性化推荐的功能。它是这么工作的：你往购物车里加入一件商品，更多的推荐商品随即展示在你眼前；你再添加一件商品，所推荐的商品也随之变化。据Greg所说，尽管原型程序看起来很有前景，但市场部门的一位高级副总裁极力反对，宣称那样会在结账的时候分散人们的注意力。Greg被勒令停止这方面的工作。然而，Greg做了一个可控的实验，结果这个功能为公司赢得了很大的利润，以致于如果关闭它会显著影响到亚马逊的营收。情急之下，基于购物车的推荐功能正式发布了。自那以后，多个网站“抄袭”了这种购物车推荐功能。

亚马逊的实验文化（数据胜于直觉）以及一套易于做实验的系统，使得亚马逊能够快速而有效地进行创新。

如果你能轻松地把基于购物车的推荐功能开放给一半的用户，然后观察其效果，何必还要去询问用户他们是否喜欢这个功能呢？网站应用特别适合这种观察测试，因为在服务器端通过一系列的HTTP请求来收集用户行为数据，这做起来很容易。通过这种方式，你甚至不必真的去现场“观察”用户。即使你是在开发传统的桌面应用程序，只要费点心，你也可以做同样的数据分析。Jensen Harris讲述了微软是如何在Office 2003里收集用户行为数据的：

假如你想知道Office 2000的哪些功能人们用得最多。好吧，你只能去问一个“专家”——他已经用这个产品用了很长时间。专家说，“所有人都用AutoText用得很多。”专家的声音越高，他们的意见就越有价值。然后，你就会听到这种奇闻异事，“圣诞节的时候我待在家里，看到我妈在使用普通视图……也许大部分新手都这么用吧。”专家还会提出一些帮助性的建议，“我听百思买的一个家伙说，大部分人都使用多个显示器。”

SQM代表Service Quality Monitoring（服务质量监控），它只是一个内部名字，而在公司以外就是大家熟知的“客户体验改善计划”。它是这样工作的：Office 2003的用户有机会选择参加这个计划；从这些人中，我们匿名收集无法逆向追查的数据——这些数据具体描述了软件是怎么被使用的，以及在什么样的硬件上被使用。（当然，我们不会收集任何个人身份信息。）

作为设计师，我们定义了我们有兴趣了解的数据点。为了收集这些数据，软件做了专门的“插桩”。所有收集回来的数据聚合在一个巨大的服务器上，然后像我这样的人会去使用这些数据，以辅助某些决策。

我们收集什么样的数据呢？实际上，从用户执行了什么命令及其使用频率，到他们有多少个Outlook邮箱目录，我们无所不知。我们知道你使用什么快捷键。我们知道你在“日历”上花费多少时间，以及你是否定制了工具条。简而言之，只要不危及用户的隐私，我们会收集所有我们感兴趣并且有用的信息。

这听起来有点古怪——他们像黑社会老大一样——但是，SQM不过是把任何Web应用程序都能轻松“享用”的报告机制扩展到桌面应用程序而已。

这种数据的真正威力在于，你可以在远程悄悄地“观察”用户，搞明白他们在用你的软件做什么；这个过程还是自动的。现在，你就能回答像“Word 2003里用得最多的5个命令是什么？”这样的问题了。答案可能会让你吃惊哦！你知道吗，你的应用程序里最常被使用的5个功能是什么？

请别误会！我热爱用户。我的好朋友中有一些就来自于用户。但就像我们所有人一样，他们是靠不住的（尽一切努力也无济于事）。在可用性方面，为了超越靠猜测行事，你必须去观察用户如何使用你的软件，除此之外别无他法！在做设计的时候，如果能基于用户对你的软件的实际使用方式来做决定（而不是基于他们口述的或者你自己想象中的使用方式），岂不是更合理？不管你是在“低保真的可用性测试”中观察用户，还是收集用户行为数据、然后在无形之中观察用户，宗旨是一样的：别问，须观察！