制约大数据发展的核心因素是什么?

本文尝试从大数据产业链的各环节入手,谈谈当前制约其发展主要因素。

众所周知,大数据按照处理流程可以分为三步:

  1. 大数据采集和清洗
  2. 大数据存储和分析
  3. 大数据展现和应用

从以上这三个方面,我想谈谈制约大数据发展的几个核心问题。

一、大数据采集和清洗

1.1、数据法规:用户隐私如何保护、商业规则如何制定、法律规范如何制定等等一系列法律法规都大大滞后于大数据科学的发展速度。由于技术EXE所限,纸上谈兵TXT成为常态。当前数据法律法规未明,采集方式八仙过海,预计未来很多大数据业务都将会继续游走在灰色地带,只有当商业运作初具规模并开始对消费者和企业产生影响之后,相关的法律法规才会被迫加速制定出来。(法律大数据研究与应用)

1.2、数据质量:由于大数据产业刚刚起步不久,目前在具体的某一领域或行业内,尚未有成型的数据采集、加工、分析和应用链条,大量数据源未被激活,包括政府在内的很多权威数据机构,普遍存在数据缺失、噪音多各方面的问题。举个栗子,如果一个电商网站销售额的20%是与推荐系统相关的时候(亚马逊是35%Was Amazon’s recommendation engine crucial to the company’s success?),投入和产出是不成比例的,这也是很多小微企业难以为继的原因,技术上每1%的进步都需要100%的汗水和努力,1%的误差都会极大地影响企业的市场份额。

1.3、数据人才:去年我参加了「2016年中国大数据产业峰会」,当时清华大学的一名教授预言:

未来 3 年,中国需要 大约 180万大数据人才,但目前只有约 30万人。

作为国内TOP2的知名学府Tsinghua当然不会落后,2014年就开始了动作( 清华大学培养跨学科交叉融合数据科学研究生),虽有些跟风的嫌疑,但至少是顺应发展。由于数据人才稀缺,大多数数据企业没有数据价值外化、将数据变现的有效路径,只能躺在金矿上睡觉。而在实际项目实施过程中,数据专家们不得不花费大量时间在数据清洗上,对原本就稀缺的数据人才其实是一种资源浪费。另一方面,数据专家们不但需要解读大数据,同时还需深谙某行业发展各个要素之间的关联,甚至包括策划、管理、执行等许多具体要素,这里就不赘述了。


图 1.1 清华大学互联网大数据研究中心)

二、大数据存储和分析

2.1、数据隐私:理论上,用户和企业的原始数据沉淀在数据平台上(如BAT),数据平台在未获授权的情况下不能提供给第三方,但实际情况是用户对原始数据的占有获取权及公开权基本取决于用户与平台达成的协议「用户须知」,加上互联网本身的开放性和某些企业故意作恶,用户基本无法捍卫自己的数据财产所有权。


(图 2.1 某网站的免责声明)

2.2、数据安全:棱镜计划(PRISM)曝光,我们知道美国政府已可以从电邮、短信、视频、照片、存储数据、甚至语音聊天等全方位对人进行监控,大数据挖掘让互联网世界已无死角可言。这同时证明黑客攻击方的能力和范围已无限升级。中国最顶尖白帽团队Keen的创始人王琦说:

大数据时代,数据就是钱。

数据黑客可以从互联网中盗取各种数据,互联网地下社工库(互联网社工库的传说,这个是真的存在吗?)就是最好的证明。

三、大数据展现和应用

3.1、数据展现:众所周知,数据的价值无法估量,但只有在被展现时才能发挥出来。高维数据可视化目前仍是一个棘手的问题,比如如何判断当前降维算法是否是合适?如何选择合适的数据展现方法?仍然拿推荐系统来举栗子,推荐的准确率、覆盖率、多样性、惊喜度等应该如何取舍才能提高用户满意度?这些都需要数据分析师对业务和技术都有相当程度的了解,因为数据科学本身是一个交叉学科,涉及统计学、计算机科学、商业领域经验等多种知识。

3.2、数据产业链:如果没有对某个行业整体产业链的宏观把握,单个企业仅仅基于自己掌握的独立数据,就无法建立产业链各个环节数据之间的关系,也就无法对业务发展和应用做出精准的判断(通俗说就是难以将数据变现)。数据分析师如何将大数据层面上的关联具象到行业实践中?如何如何制定可执行方案应用数据挖掘的结论?当前的现时情况需要处于大数据生态圈中的企业需要进行合作,方能实现共赢。


(图 3.1 大数据产业图谱)

3.3、数据独占性:合则两利,斗则俱伤。正因如此,国家为了促进大数据产业的发展以及小微企业创业,提出建立数据交易所的概念。然而另一方面,除了少数大企业如BAT自成体系外,这些需要共享信息的小微企业之间往往存在竞争关系,数据作为一种排他性的资源,越是稀缺的数据才越具有价值。所以共享数据时需要权衡利弊,这也在一定程度上限制了大数据企业的合作。

四、总结

大数据不是万能的,但没有数据是万万不能的。

当前大多数企业的信息化程度不高,管理层尚未形成相应的数据思维。换言之,大数据产业还有很长的路要走,在摸着石头过河的时候,探索出独特的数据之道也许更为重要。

PS.其他技术层面问题,如大数据相关的软硬件成熟度、成本,大数据应用的普及率、计算实时性等,鄙人以为在不远的将会都会一一攻克,至少目前不会成为制约大数据发展核心的问题,所以在这里就不作讨论了,其他有时间再补充。

本文作者:Han Hsiao

来源:51CTO

时间: 2024-09-11 00:13:36

制约大数据发展的核心因素是什么?的相关文章

深度解析制约大数据发展的三大因素

本文为鄂维南院士访谈整理,文中探讨了中国在大数据发展中受到了哪些因素的制约. 近来,大数据如浪潮般席卷全球.越来越多的国家开始从战略层面认识大数据,中国亦如此.然而任何发展都不应盲目跟从,而应该在发展中不断认识其发展的意义与遇到的困难挑战,要做到及时发现总结,才能更好的发展. 那么,制约我国大数据发展的因素有哪些呢? 1.优质可用数据缺乏 很多人看到这点可能会感到奇怪.这几年数据交易机构如雨后春笋,"数据变现"成为很多拥有数据积累的传统企业的新的生财法.如图,2015年以来,各地加速建

数据挖掘:大数据发展的核心驱动力

近年来,随着"大数据成为热门词汇,金融业在这一领域不断进行研究和探索.就金融业和大数据相关问题,本报记者近日专访中国民生银行发展规划资深 专家王彦博.王彦博认为,数据挖掘是大数据发展的核心驱动力,金融业依托大数据东风,通过有效运用数据挖掘,能够更好地识别客户和服务客户,实现与客户的 互利共赢.同时,他认为,贵阳在发展大数据产业中思路清晰.战略方向明确,相关政策对大数据人才具有一定吸引力,并由此带来大数据相关理念.技术.设施和 应用发展,可为大数据产业.金融行业等发展带来重大机遇. 国内大数据产业

出现重复建设苗头 大数据发展莫入歧途

大数据以其"浅显易懂"的概念和预想中的巨大应用前景,成为了继云计算.物联网之后信息技术领域的又一热点.但在各界的加倍关注中,国内大数据领域的明显进展未现,却已经显示出或多或少的"泡沫".借大数据之名圈钱圈地或进行重复建设的苗头已然出现.这种情况下,需要深化对大数据内涵与特征的认识.基于对大数据的跟踪研究,赛迪智库认为,可重点从四个方面进行认识和把握. 大数据发展的重点在于对数据对象的分析与应用 曾听到专家对某地方政府领导建言,建设大规模的数据中心,备份存储用户的数据

《上海市大数据发展实施意见》出炉 未来核心产业产值将达千亿

 10月27日消息,上海市政府近期发布<上海市大数据发展实施意见>.10月27日,上海市经信委举行政策解读会议,对这一政策进行解读.其中,上海大数据核心产业将达到千亿级别,建成3家大数据产业基地,培育和引进50家大数据重点企业,形成一批服务经济社会民生的大数据融合发展新业态. 以下是实施意见全文: 上海市大数据发展实施意见 为贯彻党的十八届五中全会"实施国家大数据战略"部署,落实国务院发布的<促进大数据发展行动纲要>.国务院办公厅<关于运用大数据加强对市场

也谈大数据发展的两大核心主题

大数据时代是知识管理发展的高级阶段和社会状态,其最大的特征,一是实现了"知识"内涵和外延的突破,大数据实质上就是爆炸后的知识体系;二是实现了将知识管理从组织向社会的宏观拓展.探索.思考大数据,一方面离不开知识管理经典理论,另一方面必须充分考虑到"高级阶段和社会状态"这两大特征. 大数据实际上提出了全社会.全人类的知识管理问题,将全人类和全社会作为一个统一的组织系统是大数据的认识前提.毫无疑问,如果全人类成为一个凝聚而致密的组织,那不可能有其他组织在规模.复杂性等任何

透析国家安全视野中的大数据发展问题

近年来,我国所面临的外部安全形势日益严峻.以习近平同志为总书记的党中央在治国理政的实践中高度关注国家安全问题,成立了中央国家安全委员会并由党的总书记亲自担任主席,确定了每年4月15日为全民国家安全教育日,亲切接见了全国国家安全机关总结表彰大会代表,组织编写了<总体国家安全观干部读本>,体现了新一届中央领导集体对国家安全的高度重视,使得以爱国主义为核心的民族精神充分彰显,让广大人民群众在精神上为之振奋.习近平总书记关于"必须坚持总体国家安全观""国家安全是头等大事&

智能互联时代 大数据成企业核心资产

文章讲的是智能互联时代 大数据成企业核心资产,在4月8日的中国基金业金牛奖颁奖典礼现场,国务院发展研究中心企业研究所所长马骏发表了<智能互联时代的企业变革>.在演讲中提到了企业当下需要关注的4个趋势:1.产品从硬件转为软硬并重;2.企业与用户的交易转变为长期服务;3.大数据成企业核心资产;4.企业间竞争演变为产业生态圈竞争. 国务院发展研究中心企业研究所所长马骏(图片来源于网络) 以下内容整理自网络公开的演讲实录: 上世纪90年代,做投资的思路是重点寻找"中国的GE.索尼"

先行先试创新大数据发展体制

党的十八大以来,以习近平总书记为核心的党中央提出并确立了"创新.协调.绿色.开放.共享"的五大发展理念.近年来,贵州省大力实施大数据战略行动,建设国家大数据(贵州)综合试验区这一国家级平台,在经济社会发展各领域开展大数据发展应用先行先试工作,以创新探索践行五大发展理念. 以创新引领欠发达地区后发赶超 习近平总书记指出,科学技术越来越成为推动经济社会发展的主要力量;大数据等现代信息技术深刻改变着人类的思维.生产.生活.学习方式,深刻展示了世界发展的前景;全党全社会都要充分认识科技创新的巨

四川成立大数据发展研究会 拟建公共云暨数据交易中心

5月31日,由四川省发展和改革委员会主管的四川省大数据发展研究会在成都成立,将围绕战略性新兴产业,重点开展公共云.专家库.交易中心和标准化建设.来自全省200多家与大数据产业链.供应链.价值链有关的大数据取向型企业,以及16家研究会发起单位的负责人参加会议. 四川省人大常委会副主任刘道平出席成立大会并表示,四川省对大数据发展高度重视,许多地方就大数据发展作出了长远规划并进行了积极探索和实践,一些项目已经走在全国乃至全世界前列.但是,由于四川省大数据发展起步较晚,加之各方面条件的制约,人才不足,发