文章讲的是童小军:用户是大数据的本质驱动力,“大数据”自诞生之日起,业界对它的概念、技术和应用就存在一定争议。究竟什么是大数据?有哪些大数据技术?大数据的未来是怎样的?每个人都有自己的理解。在2013大数据产品评选活动举办之际,笔者采访了此次担任评委的几位专家学者,看看专家眼中的“大数据”是什么样的?
童小军,EasyHadoop开源社区创立者、Hadoop云计算讲师,专注于Hadoop大数据技术普及和推广工作,致力于让Hadoop大数据应用更简单。曾任暴风影音数据研发经理、搜索引擎研发经理。RedHadoop公司提供Hadoop相关解决方案,致力于构建简单、稳定、高速的Hadoop基础平台和外围垂直应用级解决方案。
“大用户”是互联网大数据的本质驱动力
关于大数据的定义,童小军表示,“大数据”只是材料,“大用户”才是互联网大数据的本质驱动力。他认为,大规模感知、联通、计算、识别、策略,以及反馈和预测,产生运用于个体和群体的 “小数据集合”,基于此让个体更好的做出决策动作才有价值,大数据的价值在计算和流动中体现。
而“大用户”是通过用户历史行为产生的大数据作为挖掘和预测的依据,并从挖掘信息中产生出为个体提供决策的小数据,是基于个体独立服务的一种能力。比如阿里微小企业个人金融就是一个经典案例。
▲Hadoop大数据红象(RedHadoop)云腾公司创始人 童小军
开源技术生命力才会长久
谈到大数据技术,童小军认为针对不同需求场景会有对应的不同技术,不同的技术支撑需求的场景,比如批量处理MapReduce、实时存取HBase、流计算Storm等。
大数据构建长期的基础设施,首先要选择一项开放的技术,只有开放的技术才有长久生命力。以Hadoop为核心的相关技术,以及相关NoSQL开源系统都是不错的选择,比如Cassandra、HBase、MongoDB、数据挖掘分析可以考虑R。对于自主研发能力较弱的公司可以考虑对应开源技术的商业版本。
童小军对非结构化音视频数据的未来比较看好,生活中海量的音视频数据价值尚待挖掘。比如其正在研发的基于Hadoop的音视频数据库Video SQL Analyzer就是针对这一类场景的解决方案。
谈到大数据的未来,他认为大数据的到来让未来世界越来越集中。如果单个核心失效会导致人们整体知识和能力降低,比如我们越来越依赖于Google查询解决问题、找路、购买商品,并将某些需要记忆的知识内容保存在网络之上。将来越来越多的业务系统将迁移至云端,其中数据安全性问题导致的社会问题会被放大。整个社会的耦合性更大,鲁棒性也差了。
作者:小野
来源:IT168
原文链接:童小军:用户是大数据的本质驱动力