浅谈数据产品

  互联网是个制造流行概念的行业,“数据产品”也毫无例外。实际上,数据产品的“实”早就由来,只是“名”是后面几年才慢慢流行起来的。

  讨论数据产品的文章我看过很多篇,大家没有统一的认识,对概念的理解也有不同的地方,所以想简单表达自己的观点,主要内容也是不会在其它网文看到的一家之谈。

  一、什么是数据产品

  要谈清楚数据产品,首先不可回避的“俗套问题”便是数据产品的定义认知。我的理解是:从广义来看,数据产品是可以发挥数据价值去辅助用户更优的做决策(甚至行动)的一种产品形式。它在用户的决策和行动过程中,可以充当信息的分析展示者和价值的使能者。从这个角度讲,搜索引擎、个性化推荐引擎显然也是数据产品,由于产品形态已经比较成熟,所以很少被人划分到数据产品的概念里,另外,这类产品往往大都在数据外面穿了一层外衣,使非专业的用户并不能直观的感受到数据的存在。

  除此之外的,便是狭义范畴的数据产品,比如大家熟知的淘宝数据魔方、百度指数、电商的CRM平台、各种公司内部的数据决策支持系统等都是数据产品,我后面会有个结构化的分类介绍。

  二、为什么会有数据产品

  人们日常的商业活动都是“决策”和“行动”的螺旋上升过程及交织在一起的子过程,主过程里的决策表示内心拿定一个主意要怎么做,要达到什么样的目标,行动是具体的执行过程,比如用户要解决出行不方便的问题,他的主决策可能是“买一辆适合自己的轿车代步”,而在具体行动过程中,马上又会面临“买什么车”、“在什么渠道买”等子决策问题。

  所有的决策以及行动中的子决策过程都是基于“某种参考”的,最简单的参考可以是自己的直觉,好一点会依赖“过来人”的主观经验,但拍脑袋决策越来越难,所谓专家也屡屡被打假;而最优的决策需要依靠“证据”,定量的证据即时数据,随着数学、统计学、计算机科学的普及,数据在决策优化过程中的价值越来越大,在大数据时代尤其如此。

  决策过程中,数据的价值可以通过什么来体现?不外乎三种:a.数据本身、b.数据服务、c.数据产品。举个例子来说,如果某用户想知道明天的天气是否适合出行,他可以直接看明天的气温数据,这个就是数据本身在发挥价值;他也可以咨询相关的数据分析师或咨询顾问,由他们提供人工的数据服务或解决方案来判定明天的天气;第三种方式便是使用数据产品,它把数据、数据模型以及分析决策逻辑尽可能多的固化到一个软件系统中,以更自动化、更准确、更智能的方式来发挥数据的决策价值。

  三、数据产品的分类

  在狭义的范畴里,从使用用户来看,可以是企业内部用户,外部企业客户,外部个人客户等。从产品发展形态来看,从最初的报表型(如静态报表、DashBoard、即席查询),到多维分析型(OLAP等工具型数据产品),到定制服务型数据产品,再到智能型数据产品、使能型数据产品等。

  由于报表型数据产品过于苍白、可视化能力有限,而多维分析型数据产品更适合于专业的数据分析师而不是业务或运营人员,使用局限性也越来越大,所为未来的趋势可能是定制服务式和智能式的数据产品。

  所谓定制服务型数据产品,是基于用户的深层次需求,构建最适合当前业务痛点的数据模型、产品设计、可视化方案等。在这里数据产品充当的更像是服务提供者,而不是一个通用的工具。

  智能型数据产品则会更多的将大数据的智能性融入产品,并与决策逻辑结合起来,发挥作用。比如,你可以有一套传统的会员营销系统,允许你按自己的规则筛选目标用户;而也可以在更智能的数据产品中这样来实现:输入你的营销目标及参数,比如要开展双十一母婴市场的促销活动,系统可以基于以往海量数据计算出应该选择什么品类的商品,在什么用户群中,以什么形式开展活动效果会更佳。

  现有的大多数数据只是告诉你现在或未来的情况是怎样的,问题痛点出现在哪里,但却不能给出更完善的建议,甚至支持一个建议的执行。使能型数据产品要做的就是这样的工作,它不仅可以告诉你,哪些用户流失的倾向性大,还可以直接引导用户展开后续补救的执行流程,哪些细分群体需要通过促销活动刺激,哪些需要服务关乎,哪些需要为他提供专享的VIP业务,哪些需要更好的互动等等。

  四、数据产品需求把握的特殊性

  一个真正好的数据产品要首先把握一个核心——找到用户的真正核心需求、痛点。这句话对于非数据产品的产品经理来说简直就是天经地义的废话。但对于一个数据产品经理而言,得来却不那么容易,有其特殊性。

  第一个特殊性,是需求层次特殊性,数据产品的用户中往往会有很多内部用户,他们对数据、数据分享、数据处理的理解和熟练程度各有不同,因此会提出各种不同层次的需求,概况起来大致包括:1).业务/管理需求;2).分析需求;3).数据需求。举例来说,某电商要改善全体用户的订单转化效率,这个便是第一类需求;为了完成此目标,会有很多工作要做,也会有很多分析需求随之产生,比如分析商品详情页的跳出趋势,便是第二列需求;而具体某某数据项的统计则属于数据需求。最可怕的便是,需求方遇到了问题(第一类需求),指定了错误的分析策略(第二类需求),有提出了明确的数据需求(第三类需求)。而对于数据产品经理,从数据需求,引导出分析需求,进而介入反应具体痛点问题的业务/管理需求,是一门必修课。

  第二个特殊性,是内部数据产品需求方的特殊性,企业内部的数据产品的用户,既是是用户,也是自己的同事、朋友、领导、下属,他们本身就对产品经理的决策权有一定的干预能力,需要产品经理去平衡“理想与现实”,你懂的。这种情况对于非最高决策者直属的数据团队而言,尤为严重。

  五、数据产品的三个关键要素

  我认为,要成就一个数据产品,需要关注三个关键要素:1).数据、2).决策逻辑、3).行动流程。

  数据的价值,毋庸置疑。它就像整体产品内部流淌的血液。具备什么样的数据类型、数据周期、数据粒度,往往会决定你的数据产品可以提供什么服务。

  决策逻辑是很多平庸的数据产品所欠缺的,它们只是简单的、响应式的展示了需求方的报表。好的数据产品,应该可以帮助用户思考,尤其是将平时用户遇到业务痛点是的决策逻辑,部分或全部融合到数据产品后,可以可视化的、动态的、便捷的显性化决策的过程,提高用户的决策效率。

  仅仅停留在发现问题、分析问题是不够的,我们还需要对问题的解决能力,这就涉及到第三个关键要素——行动流程。举个例子,当数据产品分析某个细分用户群时,发现最近一个月其活跃度明显下滑,那是否可以自动触发一个营销流程,基于用户的特征,开展个性化的“行动流程”,并在流程中的各个环节发挥数据的价值。

  六、数据产品与大数据的关系

  非常不想写这样的踩着三俗概念的解释性文字,因为大数据是一个被所有人提起,但几乎所有人又不明白的概念。我在这里写什么概念解释都是错的,徒增搜索引擎的“负荷”。

  所以,还是回溯到核心价值角度来看:前面提到数据产品最大的价值在于辅助使用者优化决策,以及辅助决策价值的实现。如果把数据产品比作一台机器的话,那数据就像这台机器运转的原材料。“原材料”+“处理过程”+“结果展示与应用”≈数据产品。

  而大数据当然也属于数据的范畴,它好比是一种更高效的原材料,可以提供更高效的价值(更多角度的、更深度的、更实时的信息与知识,尤其是预测性的知识),“高效的原材料”+“高级的处理过程”+“高级的展示与应用”结果也是数据产品,当然你也可以土土称之为“大数据产品”。

  再举个不专业的例子来理解:大家熟悉的“天气预报”就是一个典型的数据产品,它的原材料可能有很长时间段的温度、湿度、风力、日光强度、紫外线强度、PM2.5值、位置信息、卫星上的采集的各种数据、其它地面设备的各种专业的气象相关数据(示例而已,专业人士请自行补充);对这些数据的筛选、清洗、分析、挖掘等一系列“处理过程”可以得到未来几日在几个核心气象特征的数据值与概率(温度、风力、阴晴雨雪等);而我们看到的天气预报这款数据产品,则是将上述核心信息综合到一起,赋予视频+GIS的展示形式,以及复制大众在“行动”方面的建议(出行建议、穿衣指数、洗车指数等)而成的。

  而这种大数据结合数据产品发挥更大价值的例子身边还有很多。试想,你如果能够准确预知明天某只股票的涨跌趋势,比费尽心思基于部分历史信息总结出来的规律要有价值的多;你如果可以知道下个月哪些用户会突然对母婴类商品大宗采购,也会节省很多“千人一面”的传统广告费用。

  而一个数据产品的产生过程,最合理的恰恰就是从价值驱动的角度出发的。而不是单纯的从数据出发或者从技术出发。

  最后:数据产品的6个方面写下来,有概念,也有白话的示例,初衷是想从基本的生活常识和基本的逻辑角度出发去看待所谓的“新生事物”,而不是动辄各种专业术语,写者高高在上,听众云里雾里的感觉。

时间: 2024-09-13 14:53:43

浅谈数据产品的相关文章

浅谈数据中心的选址:混合跨城域网络

像亚马逊,戴尔,谷歌,微软和雅虎这些企业都将他们的大型内容数据中心设在华盛顿州.其中许多设施都位于一个名叫昆西的乡村小镇,因为该地区有水坝优势,能够提供低成本的绿色电力资源.同样,亚马逊在华盛顿的Umtilla建立了一处数据中心,以获得低成本水力发电.距离这些农村地区最近的城市西雅图和波特兰也有300公里,像其他远程数据中心一样,选址在这些地方的数据中心也面临着许多新的挑战,其中包括: 浅谈数据中心的选址:混合跨城域网络 1.增加了跨区域带宽需求 随着数据内容的快速增长,正推动许多大型企业的数据

浅谈数据分析师的级别

1.数据跟踪员 虽然这个工作的人还不能称作数据分析师,但是往往作 这样工作的人还都自称是数据分析师,这样的人,只能通过×××系统看到有限 的数据,并且很少去处理数据,甚至不理解数据的由来和含义,只是机械的把自 己看到的数据拷贝出来,转发给相应的人. 这类人发出来的数据,是否有 意义,怎么解读,他自己是不知道的,只能期望收到数据的人了. 2.数 据查询员/处理员 这些人可以称为分析师了,他们已经对数据有一定的理 解了,对于大部分数据,他们也知道数据的定义,并且可以通过监控系统或者原 始的数据,处理

浅谈数据建模(原创)g

数据模型 数据模型是指用实体.实体的属性.实体之间的关系对企业在运营活动中涉及到所有业务概念和业务活动进行统一的定义和描述.数据模型是业务人员和技术开发人员之间沟通的平台.这里先解释下两个概念 实体:现实世界中存在的可以相互区分的事务或概念念称为实体.实体可以分为事物实体和概念实体.例如:一个学生.一个工人等是事物实体.一门课.一个班级等称为概念实体.实体的属性:每个实体都有自己的特征,利用实体的属性可以区别不同的实体.例如.学生的属性为姓名.性别.年龄等 数据建模 数据模型是抽象描述现实世界的

浅谈中国互联网产品体验

越来越多网民知道"用户体验"这个词,虽然他们可能并不完全了解用户体验所包含的内容,但至少他们能告诉你怎样才好,怎样是不好的. 和Web1.0时代不同的是,Web2.0时代网站百花齐放,用户不只有一个选择,相反,用户有很多选择.如果一个网站的用户体验做得非常差--除非用户必须使用这个网站--否则用户将会慢慢离开. 这期极客观察就抛弃以往只称赞不批评的风格,尝试分析中国互联网上用户体验极差的一些产品.服务和现象. 一.别这么繁琐行不行? 当我们的观察员在各个微博问他的关注者,"你

浅谈数据中心高可用网络系统设计

数据中心的故障类型众多,但故障所导致的结果却大同小异.即数据中心中的设备.链路或server发生故障,无法对外提供正常服务.缓解这些问题最简单的方式就是冗余设计,可以通过对设备.链路.Server提供备份,从而将故障对用户业务的影响降低到最小.但是,一味的增加冗余设计是否就可以达到缓解故障影响的目的?有人可能会将网络可用性与冗余性等同起来. 事实上,冗余性只是整个可用性架构中的一个方面.一味的强调冗余性有可能会降低可用性,减小冗余所带来的优点,因为冗余性在带来好处的同时也会带来一些如下缺点: w

浅谈数据中心里的光纤测温技术

数据中心对温度要求很高,要全年365天恒温.但是,实际上在数据中心机房内部,不同位置的温度是有差别的,如果通风不好,虽然在同一个数据中心里温度也可以相差好几度,这样局部位置的温度比较高,长期处于这个位置的设备就会受到影响,甚至会加速设备的运行老化,所以一般在数据中心里会部署一些温度传感器,对数据中心的局部温度进行监控,使用方式有热电阻传感器.热电偶传感器.特殊的半导体传感器等,不过这种方式单点测量范围小.布线复杂.容易损坏.维护工作量又大,往往一个通道内只设1-2个温度采集点,采集点数量太少,无

浅谈互联网产品的情感化设计

相信关注情感化设计话题的人大部分都看过诺曼的<情感化设计>一书,但诺曼谈得太宏观.太概念化了.我想谈谈对互联网产品情感化设计的理解及操作方法. 我理解的互联网产品情感化设计就是产品不单要实用.易用还要让用户感到愉快.当用户使用这个产品不单完成了任务(某种需求),还用得很愉快时,他不单自己会对产品产生良好的印象,还会把这种感受告诉朋友,我认为这就是情感化设计达到的效果. 对情感化设计的分析,诺曼提出一个重要观点"本能水平的设计--外形,行为水平的设计--使用的乐趣和效率,反思水平的设计

选址攻略:浅谈数据中心选址 混合跨城域网络

像亚马逊,戴尔,谷 歌,微软和雅虎这些企业都将他们的大型内容数据中心设在华盛顿州.其中许多设施都位于一个名叫昆西的乡村小镇,因为该地区有水坝优势,能够提供低成本的绿色电力资源.同样,亚马逊在华盛顿的Umtilla建立了一处数据中心,以获得低成本水力发电.距离这些农村地区最近的城市西雅图和波特兰也有300公里,像其他远程数据中心一样,选址在这些地方的数据中心也面临着许多新的挑战,其中包括: 1.增加了跨区域带宽需求 随着数据内容的快速增长,正推动许多大型企业的数据中心必须实现跨城域,区域界限提供较

浅谈做好产品站seo的五大成功要素

目前,电子商务随着网购热情的不断高涨而突飞猛进的发展,不少新手站长朋友涉足电子商务,并想通过seo赚得一笔.下面探讨一下产品站seo的操作方法. 一 关键词的选择. 关键词的选择是网站成败的重中之重,作为新手站长,我们不可能有很多资源去做一个超高难度的关键词. 成功并不只是你能把"减肥""瘦身"做到首页,你可以选择竞争稍弱的长尾关键词去做,例如,你可以做"高中生如何减肥""女生如何减肥"等竞争稍弱的关键词.事实证明,越是长尾关