大数据:第二次数据革命

    曾几何时,数据是人类用于识别环境的计数工具,对其精确性的关注似乎仅限于科学研究领域。进入信息化时代,我们每一个人都明显感受到与信息相关的数据无处不在。可以说,我们自身在不断产生各种数据的同时,数据也在极大地影响我们。

  两次数据革命融合数据与科学研究

  在数据的发展历程中有过两次革命。第一次数据革命是近代科学诞生之时,实现了数据与科学研究的融合,数据在科学研究中的基础地位得到确立。对研究过程和结果赋予精确化的诉求,是近代科学的基本特征之一。在以数据为依据的研究范式中,数据的可靠性和准确性代表了研究的精确性,人们甚至将以数据为依据的实证研究作为判断“科学”与“伪科学”的标准。

  随着科学和技术的发展,数据的形式和内涵也在不断变化和发展。除观测数据、实验数据、理论数据、统计数据、模拟数据等外,图、表、文字均被纳入数据行列,形成了结构化数据和非结构化数据的多元化数据形式;信息技术的发展导致从数据匮乏向“数据丰富,理论匮乏”方向转变,数据产生的速度和规模急剧发展;数据所蕴含的信息远远超出其工具性和依据性特征,形成可以从中挖掘出新知识的大数据。与统计数据相比,大数据强调的是全部样本;与科学数据的精确性相比,大数据允许存在一定范围的不准确性;与科学范式的因果关系相比,大数据通过关联性寻求自然和社会的变化规律。因此,大数据引发了第二次数据革命,它不仅改变着科学研究范式,实现社会科学研究的定量化,也将促使经济、社会、军事等所有社会领域产生巨大的变革。

  大数据促进社会科学定量研究走向深入

  在科学研究方面,通过遥感装置、感应器、计算机收集数据或模拟方法获取的密集型数据,经过计算机软件处理,产生的信息/知识被存储在计算机中,科学家们只需在后台利用数据管理和统计的方法对数据进行处理、分析,获取知识,形成以大数据为基础的密集型科学,成为格雷提出的数据驱动科学的第四种科学范式。正如EPJ Data Science杂志所指出的,21世纪面临的数据驱动科学已成为传统假说驱动科学方法的补充,这种进化伴随科学范式从还原主义(简化)到复杂系统科学转变的变革。

  大数据可能导致社会科学研究的革命,促进定量研究的深入。大数据突破了自然科学和社会科学的研究界限,实现了数据的可通约性,通过数据沟通了不同学科的资源。哥伦比亚大学沃茨博士通过研究发现,大数据对极其复杂的人类行为的社会学研究起到了极其重大的作用,通过网络数据,大量个人或很小组织的真实行为通过计算机以数据形式被记录下来,这些数据为人类行为研究提供了极其丰富的可靠信息,避免了研究者认知的偏见、感知的误差和框架的歧义。

  大数据对经济、社会、人类日常生活产生的影响不仅仅限于技术层面,对于管理理念、运作方式也都将产生巨大的影响。“数据驱动的社会管理”就是在社会管理中实施的一种新型管理模式,无论是政府还是组织机构,数据收集和分析已经成为基层管理部门的基本要求,根据数据分析结果制定政策和法规,将社会管理从事后处罚转向事前防备,在医疗健康、国土安全、智慧城市建设、防范和打击恐怖活动、社会治安、治理社会腐败等方面发挥着重要作用。20世纪美国的警务管理模式CompStat是利用大数据对社会治安进行管理并取得良好成效的成功范例。利用地方各种传感器收集的大数据和通过互联网搜索关键词,疾病控制部门可以预测和判断某地的流行病爆发的情况。商务智能实现了从数据到知识的挑战和跨越,“决策支持系统”更是以数据和信息为主要来源,等等。

  无论是“数据驱动的社会管理”还是“决策支持系统”,数据的获取和对数据的挖掘都至关重要,对收集到的各种数据,在后台进行分析,建立模型,利用云计算等计算手段,为制定政策、法律和决策提供技术支撑。各国已经意识到大数据的重要性,将其视为与能源同等重要的资源。2012年3月29日,代表美国政府的白宫科技政策办公室发布了《大数据研究和发展计划》,并成立了“大数据高级指导小组”,将大数据技术革命带来的机遇和挑战提升到国家战略层面。

  亟须实现大数据共享和规范管理

  与传统数据相比,大数据的资源性特征尤为突出,成为各国重视开发大数据的依据。在知识的演化过程中,数据既是产生信息、知识、智慧的基础,又同时贯穿于其中。进入信息化时代,遇到的最大难题不是信息不足,而是信息孤岛的问题,只有实现大数据的共享和规范管理,才能破解这一难题。

  在移动网络、云计算和其他技术的支持下,大数据迅猛发展,分析数据的技术不断创新,第二次数据革命悄然发生。大数据与任何一项新技术一样,在推动社会变革的同时也造成了社会风险,例如,个人隐私、数据的客观性和准确性、大数据的滥用等问题,已经遍及科学研究、社会管理、医疗保健、商务智能等众多领域。

  大数据与其他技术的不同在于其虚拟性,其隐蔽性和渗透性更加突出。这对个人、组织、国家甚至整个世界都可能带来负面影响。因而,对其进行更深层次的伦理学和哲学反思尤为重要。

原文发布时间为:2014-02-07


时间: 2024-09-08 11:07:38

大数据:第二次数据革命的相关文章

大数据市场风生水起

据IDC(国际数据公司)上个月发表的一份报告称,预计大数据技术与服务市场销售量将从2010年的32亿美元增长到2015年的169亿美元,其年均增长率会是一般IT市场的7倍.麦肯锡全球研究院指出,数据正在成为像有形资本.人力资本这类产品的一个因素.能够利用大数据的公司将会藐视数据利用无能者.数据资本将和品牌资本一样重要.商业已经在适应大数据了,数据革命正在瓦解已经建立的产业和商业模式. 无论是IT巨头还是市场新秀都觉察到了大数据所带来的前所谓有的机遇,并开始行动.IT巨头通过收购来弥补自身在大数据

大数据三重门

人类实现了信息的存储,就像Time Machine一样,回到任意一个点,通过已有的数据重新构建过去的影像,也能够预测未来,模拟一个虚拟而准确的未来环境 大数据第一重 这是大数据的第一阶段,也是大数据当前所处的阶段.这个阶段的表象是: 大数据部门在大部分公司遍地开花, 大家一拥而上 这一阶段的必然结果是: 大家发现耗费了大量人力物力, 终究是收效有限 虽然大部分企业的消耗了大量的资金,却没有带来应有的价值,但带来的一个副产品是: 企业花的钱给工业界和学术界 积累了大量的大数据人才 这些人才会在第二

深耕母婴市场大数据与机器人的完美演绎

文章讲的是深耕母婴市场大数据与机器人的完美演绎, 一直以来我们都知道科技改变未来,所以这是一个大实话,也是一个大空话我们还是来得实际的.切实体会的.在去年,孩子的一次生病让我了解了宝宝树带来的价值.一次孩子生病了,身为父母很焦急,能够获得孩子病情的并不是医生,而是感观上的认知,结合孩子的感观认知,第一时间在把进行了搜索,然后看到在宝宝树中相似的症状,也由此拉开了对于宝宝树这一家专注母婴社区的了解.另外,也因为个人职业的原因(从事互联网),之前对于宝宝树及其创始人王怀南略有了解:王怀南,宝宝树创始

大数据的下一步:AI、ML、DL

开源大数据技术Hadoop,在今年刚好满十岁.在大数据的第一个十年,Hadoop成功地让大数据成为最被看好的技术,这股大趋势,不仅影响资讯科技的走向,更成为商业热烈讨论的议题. 之所以如此,一方面是随著网际网络.云端运算.智慧行动装置的普及,使得Google.Facebook.Twitter等大型互联网公司的用户数量,呈现爆炸性成长,为了应付全球用户的规模,这些知名互联网技术公司纷纷投入大数据技术,使得大数据成为顶尖技术的指标,瞬间成了抢手的当红炸子鸡. 另一方面,这些互联网公司不仅是采用Had

GEO段培力谈大数据互联网金融营销应用

由中国金融认证中心(CFCA)主办的"2014中国电子银行宣传年启动仪式暨第二届金融品牌峰会"于4月2日在北京举行.本届峰会以"大数据时代的金融品牌营销"为主题,邀请国内外知名营销专家在现场分享了纽约国际广告节上的金融营销类获奖作品,同时解读了国内外金融业关于品牌推广的热点案例.集奥聚合首席营销官段培力先生也应邀出席,就<大数据的互联网金融营销应用>发表了主题演讲,深入剖析了互联网品牌的创新推广与大数据技术下的营销新思路. 正如广告业的一句老话:你知道广

大数据技术公司百分点今日宣布完成第二轮1000万美元融资

摘要: 新浪科技讯 7月25日下午消息,大数据技术公司百分点今日宣布完成第二轮1000万美元融资,投资方为东方星空创投和IDG资本,百分点同时发布新战略,由提供大数据技术进入到大数据管 新浪科技讯 7月25日下午消息,大数据技术公司百分点今日宣布完成第二轮1000万美元融资,投资方为东方星空创投和IDG资本,百分点同时发布新战略,由提供大数据技术进入到大数据管理与应用领域. 成立4年的百分点一直从事于大数据技术的创新,2011年7月获得IDG资本和名信中国成长基金720万美元的投资,百分点创始人

U15青训首次引入体育大数据 欢呼吧体育助力中国足球数据革命

每届中国足球的国家队或青少队选拔,教练们总会因为具体人选和球队表现等问题产生各种争议.降低经验的权重转向依托体育大数据选拔队员,能给中国足球发展带来突破性改变么? 日前,中国足协 NIKE针对 U15青少队首次引入体育大数据模型,将训练数据和具体表现作为入选U15青少国家队的重要依据.实际上,体育大数据来辅助训练及队员选拔,在全球范围内已是大势所趋. 为了挑选出最好的一届U15"足球小将",中国足协联合体育巨头NIKE,从各省150名青少年球员中精选出来50名,近日在山东鲁能足校这些青

阿里巴巴大数据竞赛结束了第二赛季的比赛

90后队伍"Marvel"队夺得冠军,获得了阿里巴巴20万元现金奖励.据了解,此次阿里巴巴向参赛选手开放了天猫真实用户4个月的5.7亿条脱敏数据.如果以北京市2000万人口换算,此次阿里巴巴开放的数据量相当于所有北京居民连续访问天猫一个月的数据量.而此次夺得冠军的"Marvel"队,其成员一位为93年生人的北京航空航天大学在读研究生,一位为89年生人的中国科学院大学在读研究生.据 阿里巴巴方面介绍,此次阿里巴巴大数据竞赛为阿里巴巴的首届大数据竞赛.第二赛季的题目是&

第二届大数据世界论坛 聚焦行业需求

本文讲的是第二届大数据世界论坛 聚焦行业需求,随着现代技术的发展,企业产生的业务数据和客户数据早已汗牛充栋.如何有效的组织管理数据,提供商业解决方案,已经不是单纯的IT技术问题,而是与企业未来发展前途攸关的关键性问题.大数据时代已经到来!大数据正在成为IT业界的焦点话题.为此,2012第二届大数据世界论坛(BIG DATA World Forum BDWF 2012)将于7月13日在北京隆重开幕,本届论坛的主题是"海量数据,深度分析,智慧商业". ▲点击进入IT168现场报道专题 作为