浅谈Web Analyze – by 佩瑛

记得很早以前看到过这样的一段介绍:

想象你在逛街边的一家书店, 如果最终你没有购买任何图书就直接离开了, 店长并不会知道你来过。但是如果你买了书, 那么书店的员工就会知道他们卖出了一些商品(当然如果你在那里留了联系信息来预订另外一本书, 他们就可以得到更多东西)。

回过头来, 我们从信息收集的角度看看网站访问, 那就是另外一个截然不同的世界了。无论你有没有买东西, 在你访问站点时, 总是会留下很多记录, 通过收集这些访问者留下的大量数据, 我们的网络专家就可以得到关于网站用户体验的很多结论。

从站点的记录中, 可以知道你走过的每个通道、点击的每个链接、拿了哪些商品、收藏了哪些你感兴趣的话题等等。甚至知道你曾就搜索了哪些宝贝, 网络广告推广商就会根据这些你感兴趣的商品, 定向的给你投放一些“可能喜欢的宝贝”。

这就是最最简单的Web分析概念了, 那么我们进行Web分析的最终动机又是什么?

你的客户需要什么? 他并不需要“可用性”和“用户体验”本身, 他真正需要的是实现他的目标, 达到他的访问动机。

狭义地看, Web分析是指分析网站访客的行为; 广泛一点来说, Web分析是指评估、调整网站各个方面的运作, 使其符合公司的商业目标。

换句话, Web分析, 最终动机并不是“报告”, 也不是算计着如何向决策者们发送充满数据的垃圾邮件。它的真正目的是获得可行动的认识和度量。

Avinash Kaushik 在《Web Analytics: An Hour a Day》一书中, 提到了单靠一些传统的web分析, 有时会带来的YY般的数据报告, 比如“退出最多的页面”、“访客屏幕分辨率”、“网站交互次数”等等, 这些度量的一个共同点是, 它们声称会说点什么, 但几乎什么也没说明白。

可是反过来思考一下, 基于日志数据的Web分析真的就一无是处了么? 答案当然是否定的。日志分析, 依旧是Web 分析的基石, 他给我们提供的是最广泛的现象呈现, 我们可以从中“知其然”。后面“知其所以然”的部分, 就需要结合定性的分析研究来发现了。

那么我们能从日志中得到哪些基础数据呢? 看看下面这个图, 纵向的把收集到的数据进行分析并划分了几个层次, 这个图也描述了一个目前很广泛使用的基于日志的统计分析步骤: 日志文件->PV->会话->使用者->客户->忠实客户, 我们可以明显地看出, 金字塔越上层的数据就越具有商业价值。


对图中一些术语的解释:

命中(Hit)和请求是同一术语。为了获得服务器上的一个资源(可以是文本、图像或任何可以被包含在页面内的元素), 浏览器和它连接的服务器之间进行的一次单一连接。日志文件中一条记录就是一个请求。

访问数(Visit)和用户会话是同一术语。从CNNIC对这个术语的定义看, 没有详细定义什么算是Visit, 什么算是Loss, 目前, 一个Visit必须至少完整下载一个页面到客户端, 如果没有完全下载就被用户关闭窗口即结束请求, 那么是一个Loss, 而不是一个Visit或称Session。一般的度量方法: 访问者在20分钟内与网站有交互活动则被认为是同一次进入网站, 不记录新的用户会话数; 当访问者持续20分钟与网站没有交互活动, 当他再次访问网站时访问者被认为再一次进入了网站, 记录新的用户会话数。

Avinash 所提出的“三位一体”的Web分析理论也正是将定性和定量合二为一的, 以使客户需求与公司目标达到双赢为目的, 得到可行动的认识和度量。

首先, 进行行为分析, 也就是我们传统认为的点击数据流分析, 分析点击密度、细分用户等等。这一步的目的是收集真实的行为, 来试图推测用户的意图。从这些收集统计的数据中, 我们并不企图找出真正的意图和问题, 而是使其为更高层次的分析面提供参考。

第二点是通过结果分析, 来找出“so what”的问题, 在网站目标明确的前提下进行实际产出变化的分析, 衡量这个web站点在满足它的存在这一目标上做得如何, 才能让上一步的数据更加有意义。

第三部分是体验分析, 这是分析的关键, 打破陈规去让用户告诉我们这些问题到底是“为什么”, 方法多是侧重定性分析的, 比如AB测试和多元测试、启发式评估、客户之声等等。这样也可以有效的避免将那些网站给用户带来的“误会”当作有效样本放入统计数据池中。

最后说几个有意思的Web分析方法:

1. 数据与可视化结合

“如果你有大量的数据, 你应该感受到它们的存在。如果你必须浏览十万行日志文档, 当你浏览到一百行时就已经忘了第一行。” —Marty

面对庞大的杂乱无章的日志数据, 将其可视化, 已经成为一种趋势, 我们十分高兴的看到, 一些主流的web分析网站都推出了很多可视化的东西, 而且并不局限于日志数据。很多时候, 换个角度, 能得到不一样的收获。

来几个典型的例子:

? 热力图: 可以应用在点击日志、眼动分析、页面展现率等等很多定性、定量的分析上

收集页面上点击的位置, 颜色越热, 表示点击量越高

在一个很长的页面上, 可以使用不同的温度颜色来表示那部分的内容更受人关注

? 文字可视化统计1: 类似流行的tag云图, 看看11月4日奥巴马胜利演说稿上出现次数最高的150个词是什么~

? 文字可视化统计2: 还是奥巴马的演讲稿, 跟在“I”后面的单词出现次数统计

? 05年中国范围内各种空气污染物污染程度统计, 颜色越深表示污染越严重

2. 4Q

我们能拿到的所有数据都只能说明What Happened。但是无论你如何严刑拷打你的数据, 都很难得到Why Something Happened。那……去问用户吧。这就是4Q主张的: 好的衡量方法是听问卷的声音, 世界上最好的问卷就只含有三个问题!

Why are you here? (用来发现用户真正的访问意图,4Q认为, 用户真正的访问意图只有用户自己知道, 这个问题的结果统计会让你大开眼界, 它可以帮助你解释很多那些在点击数据分析报告中看起来非常古怪的现象)

Was the visit successful? (任务完成率, 这是最关键的一个问题。我们可以很容易的统计出有多少用户真正通过我们的网站解决了他们的问题。)

No? Why Not? (这个问题的回答, 将会是开放性的VOC (Voice of Customer), 最好避免使用类似下拉框似的的原因选择, 在这里应该给用户用自己的话来表述意见和建议的机会, 这将会达到更好的效果)

实际上, 4Q的含义是Four Questions, 那么在上面三个问题的基础上, 还有好的添加了一个帮助综合评估客户满意度的问题: Good site experience?

4Q, 是当用户离开你的网站时, 所能看到的一个调研问卷, 它包含且仅包含上面四个问题, 用户可以在一分钟内就答完, 但这四个问题被认为是最简单有效的用户意图研究方法。

那些与点击流相关的数据, 对我们来说是缺少上下文环境的。由于这种信息的缺乏, 我们不得不掺入一些自己的理解、经验、看问题的角度, 来企图将数据分析得更有意义。而通过4Q那四个简单的问题, 我们可以得到的是所谓的“上下文”, 这也就让我们的数据分析更加有理有据, 分析出更加客观的“所以然”。

via: TaoBao User Experience Design


Have Your Say »

Required

Required, never published