孟小峰:大数据管理系统的发展与机遇

文章讲的是孟小峰:大数据管理系统的发展与机遇,2016年5月12日-14日,第七届中国数据库技术大会(DTCC 2016)在北京国际会议中心拉开帷幕。作为国内数据库与大数据领域最大规模的技术盛宴,在为期三天的会议中,大会将围绕MySQL、NoSQL、Oracle、缓存技术、云端数据库、智能数据平台、大数据安全、数据治理、大数据和开源、大数据创业、大数据深度学习等领域的前瞻性热点话题与技术展开深入探讨,并邀请一大批国内顶尖的技术专家来进行分享,以满足广大从业人士和行业用户的迫切需要。

  本届是大会创办以来,规模最大,参会人次、参展合作伙伴最多的一次盛会,云集了来自五湖四海的5000余名IT精英,相聚在这里,共话数据库技术发展潮流,共赴大数据浪潮之巅。今天,来到了大会的第二天,主题为“聚焦大数据+引领行业变革”,中国人民大学信息学院教授孟小峰进行了题为《大数据管理系统的发展与机遇》主题演讲。


▲中国人民大学信息学院教授 孟小峰

  大数据的提出

  计算机未来15年内写作90%的新闻,未来5年获普利策奖。--克里斯蒂安·哈蒙德

  孟老师举例表示,在已故的Jim Gray《事务处理》一书中提到:6000年以前,苏美尔人就使用了数据记录的方法,已知最早的数据是写在土块上,上面记录着皇家税收、土地、谷物、牲畜、奴隶和黄金等情况。19世纪后期,打孔卡片出现,用于1890年美国人口普查,用卡片取代土块,使得系统可以每秒查找或更新一个“土块”(卡片)。可见,用数据记录社会由来已久,而数据的多少和系统的能力是与当时的社会结构的复杂程度和生产力水平密切相关的。

  数据的来源来自两个“社会”,物理社会和网络社会,从现实社会发展到虚拟社会,互联网、云计算、物联网的发展让数据量有了质的提高。同时,数据产生的方式也在发生转变。具体分三类:

  运营式系统--数据源是被动产生:数据规范,有秩序,强调数据的一致;

  互联网系统--数据源是主动产生:数据结构复杂,无秩序,不强调数据的一致性或只强调弱一致性;

  感知式系统--数据源是自动产生:数据呈现多源异构、分布广泛、动态演化等。

  孟老师总结表示,大数据的理解可以总结为更细(数据记录的“粒度”更加细致,由粗粒度到细粒度的转变、由企业信息到个人信息转变)、更广(数据记录的“广度”更为宽泛,多源异构的数据源普遍存在、数据的关联、交叉、融合更为迫切)、更密(数据记录的“密度”连续不断,由静态描述到动态描述的转变、由简单分析到复杂分析的转变),传统的信息系统是先有模式后有数据。

  大数据的管理

  由模式到数据,数据库能帮助普通用户组织、存储、查询数据,并提供已知问题的简单分析;由数据到知识,数据湖能帮助普通用户收集数据、发现关联关系,并提供未知问题的复杂分析。

  据孟老师介绍,大数据管理基本问题包括大数据管理理论和方法 大数据集成:如大数据分析、大数据计算、大数据可视化、大数据隐私管理;

  大数据管理系统和技术包括如,大数据编程语言、大数据编译技术、大数据生态系统(分布、众包、实时等);

  面向新型存储器件的大数据管理包括如,新型体系结构、高效存储系统(齿轮式存储I/O=》火箭式存储)、高效节能;

  大数据应用“三要素”

  “大数据”关联和融合凝聚成“大知识”,促成开发“大应用”

  针对大数据隐私管理的问题上,孟老师表示:“大数据隐私管理的总体目标是基于数据管理理念和方法开展相关研究,具体包括如下三点:为大数据的应用提供技术支撑、为那些悬而未决的隐私挑战寻找方法、给公开数据的政府、企业和个人一个定心丸,保证国家安全底线。”

  大数据的生态系统

  大数据管理系统分类

  数据处理模式包括:批处理模式、流处理模式、混合处理模式。

  关于大数据的四大思考 今天做的还远远不够

  思考一:大数据的局限性,过去几十年人类可以量化的数据增长确实惊人,但人类无法量化的“数据”更为庞大,全世界的数据加起来也无法让机器理解爱、悲伤或恐惧。

  思考二:新的产业尚未出现

  思考三:如何不被大数据误导

  思考四:AI?VR?AR?DB?

  写在最后,孟老师引用了陈寅恪先生的话作为总结:“ 一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流(借用佛教初果之名)。其未得预者,谓之未入流。”

  对今天的信息技术而言,“新材料”即为大数据,而“新问题”则是产生于“新材料”之上的新的应用需求。

作者: 陶然 

来源:IT168

原文链接:孟小峰:大数据管理系统的发展与机遇

时间: 2024-12-09 11:12:38

孟小峰:大数据管理系统的发展与机遇的相关文章

拥抱“大数据时代” 共享发展新成果

近现代历史上的数次技术产业革命,中国均以学习者和模仿者的姿态出现.而在云计算和大数据所带来的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能.以开放的心态.创新的勇气拥抱"大数据时代",就一定会抓住历史赋予中国的这一伟大创新机会. 习近平在中共中央政治局第三十六次集体学习时强调,我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务.建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合.业务融合.数据融合,实现跨层

通信行业未来发展的“丝绸之路”:拥抱大数据时代 共享发展新成果

拥抱"大数据时代" 共享发展新成果 近现代历史上的数次技术产业革命,中国均以学习者和模仿者的姿态出现.而在云计算和大数据所带来的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能.以开放的心态.创新的勇气拥抱"大数据时代",就一定会抓住历史赋予中国的这一伟大创新机会. 习近平在中共中央政治局第三十六次集体学习时强调,我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务.建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国

全球各国大数据市场的发展现状

1 大数据发展概述 当今是一个数据爆发增长的时代.移动互联网.移动终端和数据传感器的出现,使数据以超出人们想象的速度快速增长.据调查机构估测,数据数量一直在快速增加,这个速度不仅是指数据流的增长,而且还包括全新的数据种类的增多.目前数据容量增长的速度,已经大大超过了硬件技术的发展速度,并正在引发数据存储和处理的危机.据统计,2013年全球产生的数据达到3.5泽字节,到2020年产生的数量将增至44泽字节. "大数据"一词来自于未来学家托夫勒于1980年所著的<第三次浪潮>.

交通行业大数据应用和发展现状

摘要:智能交通产业是现代IT技术与传统交通技术相结合的产物,而交通大数据产业是大数据技术在智能交通领域内的应用产业. 随着社会经济的快速发展.城市规模的不断扩大以及城市智能化进程的加快,机动车拥有量及道路交通流急剧增加,使得交通供给与需求之间的矛盾渐显,交通拥堵.停车困难.环境恶化等交通问题不断加剧,影响了城市的可持续发展及人民生活水平的提高,阻碍了社会经济的发展.在工业化进程中,最初解决交通问题的途径是通过大规模改扩建交通基础设施,但是土地资源日益紧张,用于改扩建交通基础设施的空间越来越小,交

中小银行如何实现华丽转身 大数据打造转型发展新动能

在新常态.新格局的大背景下,对于中小银行发展的根本出路,业内所达成的共识是"更大力度地进行创新与转型".然而,转型之路在何方?在7月29日举行的"2016中国中小银行发展高峰论坛"上,与会人士普遍认为,大数据的到来为中小银行"弯道超车"提供了契机. 业内人士认为,互联网时代给予中小商业银行崭新的发展环境.大数据.云计算.智能化.移动互联网等丰富的高新技术创新,为中小银行业务转型.服务优化提供了新思路与新工具.在夹缝中生存的中小银行需借此大好时机,

星巴克:大数据是零售业发展契机

       科技决定企业高度 现代社会,成功的企业都离不开高科技.例如星巴克,是领先的零售餐饮品牌,同时又非常重视ICT.根据星巴克官网的数据,目前,星巴克在大陆60多个城市运营超过1001家门店.中国已然是星巴克的"第二本土市场",到2015年,星巴克计划在中国大陆运营1,500家门店.专业人士都明白:要实现如此规模的门店标准化产品和服务,并非仅仅依靠人力和决心就可以达成.餐饮连锁企业的品牌扩张,离不开专业.安全.可靠的ICT解决方案.越来越多的企业已经意识到ICT的重要作用.仅以

北京市大数据和云计算发展行动计划 (2016-2020年)

原文发布于2016-08-23,来自国家信息中心软件评测中心 北京市大数据和云计算发展行动计划  (2016-2020年) 为深入贯彻落实<国务院关于促进云计算创新发展培育信息产业新业态的意见>(国发[2015]5号)<国务院关于印发促进大数据发展行动纲要的通知>(国发[2015]50号)<国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见>(国办发[2015]51号)等文件精神,全面推进本市大数据和云计算发展,特制定本行动计划. 一.总体要求 (一)指导思想

从“挖煤”到“挖数据” 淮南大数据产业的发展之路

2013年10月,国家批准安徽进行战略性新兴产业区域集聚发展试点;2015年7月,安徽推出第一批14个战略性新兴产业集聚发展基地;9月,出台"4105"行动计划,战略性新兴产业集聚发展成为安徽"头号工程";2016年8月,安徽推出第二批8个战略性新兴产业集聚发展基地和2个试验基地.日前,记者走进安徽省淮南市大数据产业基地,感受安徽经济转型升级的新动能. 智慧城市.数字城管.电子政务--这些向信息化转型发展的新尝试,离不开大数据.云计算的支持,而大数据企业的发展,产业

畅销书作家Mark Mueller-Eberstein :云计算大数据推动业务创新发展

ZDNet至顶网软件频道 6月5日消息 (文/邓晓蕾):第七届中国云计算大会已经到了第三天,现场观众依然爆满. Adgetec公司的CEO .畅销书作家Mark Mueller-Eberstein 带来"云计算大数据推动业务创新发展"的主题演讲,他提出,云计算对每个企业.每个人来说都是可能的,企业过去几年利用技术转型中有赢家,也有失败者,这之间的区别在哪里呢? "IT的成熟度是企业成功的一个非常关键的指标,特别是对5年或者10年历史的公司来说,它们需要这样的IT能力.&quo