在互联网公司的众多数据中,营业的数据、财务的数据往往是比较容易得到应用,但是网站访问的数据往往是应用得最少的。这是什么原因,网站数据该如何应用呢?
先说应用少的原因:
1、首先是数据的重要程度的认识。
交易数据、财务数据往往是关系到公司的生死,如果这个数据出现问题了,那么公司的运转就会出现了紧张状况。所以上到CEO,CFO;下到公司的具体员工都在关心这个数据。
网站数据只关系到公司产品自身的好坏,而在公司发展的阶段,这点上体现并不明显,在国内尤其不明显,很多公司都可以凭借一流的销售,三流的产品去抢占市场,一部分的网站,甚至不要什么优秀的产品,光是靠着大量的投资,打广告,吸引到到用户量,出业务的数据就可以融到大笔的资金,所以网站本身的数据就一定程度上被忽视下来了,而能作到在产品上大投入的公司,凭借的也不是网站的数据,而是产品人员自身的实力。
2、其次是数据处理的成本。
业务数据通每条业务是一个单独的数据,这样数据在处理的关联上简单很多,数据量也相对网站数据要少很多很多。同时在保证数据准确性方面,由于业务数据关系到财务问题,都是有多台服务器和多系统保证其准确性的。
网站数据往往是由用户-独立会话-访问页面构成的一个序列的数据,这些矩阵的数据在处理上增加了很大的难度,单单从数据量上讲,往往是交易量几十倍,数据量的增加还不是根本难度,难度是从分析一条数据,变成了分析一个序列的数据;同时另一个难度是这么庞大的数据量,已经很难保证不丢失数据了,事实上,大部分网站记录中,丢失1%-5%的数据是正常的现象,而即使是1%,对于序列的分析也有不小的影响。
3、网站数据更难于理解。
由于交易/财务是传统行业就有的,所以有比较明确的定义,交易量,交易额这些数据大部分人都能知道他的意义,(财务数据除外); 对于专业的人员,这些数据不存在任何歧义。而且在获取数据的过程中,获取方法,统计方法都比较规范,很少在这期间产生疑义。
网站的数据随着互联网的发展才发展起来,数据上没有明确的定义,往往是两个统计系统里面,同样的名词表示不同的意义;不同的名词表示相同的意义;同样的名词表示着不同的意义;名称和意义都一样,但是获取的方式不同;而且这方面的分析也少有专业人员,相关的人员,例如产品经理,交互设计师甚至有独立用户数,独立IP数,独立会话数,流量数的却别都搞不清楚的。同时,在数据获取的过程中,由于相应开发语言,跳转方式,服务器配置的不同,获取数据的方式也不统一,在理解上更增加了一层的难度。
4、网站数据应用上困难。
传统数据,往往是很容易就应用到实际当中,投入和产出的对比让很多判断可以比较容易的下决定。并且业务的情况往往是2选1、N选1的状况,当数据证明一个比一个好的时候,是比较容易作决定的。同时,由于长期的积累,交易数据有成型的数据解释结构,看到××数据,就知道这个数据是受××几个数据影响。
网站的数据往往难以下决定,数据往往是很难直接应用到实际的修改之中。除了A/Btest是方案的对比,其他的数据多数不是方案的对比,而是同一个产品的优化。某页面的转化率低,产品经理也不能直接将这个页面舍弃,还是要进行优化,这让数据的判断和处理的难度增加了许多。同时网站的数据,由于受到系统和人的意识两个方面的影响,还没有成型的结构去解释数据受什么关联数据的影响,并且,一但是判断结果是用户不继续进行操作,数据上就陷入到了荒原。
以上是网站数据对比业务数据的弱势,但是并不是说网站的数据没有意义,只是还没有到发挥的时候,等到地盘划定,各个公司要拼内功的时候,优化业务数据的时候,网站数据的作用也就体现出来了。(文/兰思的记录本http://hi.baidu.com/koob/blog/item/12e93f23dd0f4d5493580756.html)