Hadoop峰会:南航航空大数据技术应用

文章讲的是Hadoop峰会:南航航空大数据技术应用,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行。来自国内外各行业领域的近千名CIO、CTO、架构师、IT经理、咨询顾问、工程师、Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举。

  Hadoop中国技术峰会由China Hadoop Summit专家委员会主办,由IT168、ITPUB、ChinaUnix协办,渠达传媒负责承办。本届大会将秉承“效能、应用、创新”为主题,旨在通过开放、广泛的分享和交流,着力于促进中国企业用户提高应用Hadoop的能力和水平,降低Hadoop技术应用门槛和投资预算门槛,推广大数据的应用价值。


▲南航天合高级架构师于英

  在第二天下午的企业大数据实践主题论坛中,南航天合高级架构师于英带来《南航航空大数据技术应用》的演讲,分享了南航大数据的发展,以及大数据服务平台和大数据处理平台的架构设计。

  于英表示,传统的关系数据库在支持非结构化数据分析挖掘上存在技术上的瓶颈,受到关系范式的影响,扩展性和并发性比较差,成本较高,无法支持海量数据。但是大数据的环境下需要一个海量、高效的数据库,满足高扩展性、高可用性和低成本的需求。

  谈到南航为什么做大数据项目,他表示,南航目前拥有亚洲第一、世界第三的旅客量,基于原来IOC、IOE的模式支撑数据存在很大的瓶颈,所以南航才开始逐步基于开源做大数据应用支撑。航空业会产生大数据,例如波音787每飞一个来回都会产生几TB的数据。除此之外,南航还会对客户信息做大量分析,用于精准营销和产品设计。


▲南航大数据总体架构

  NoSQL作为大数据开源产品的代表,有以下优点:大数据量、高性能和高可用、弹性扩展能力、灵活的数据模型和低成本。但是又存在很多不足,例如产品成熟度不足:不能支持事务、多表查询、聚合查询等;支持力度不足:大多为开源项目,没有能力提高全球服务支持,需要用户自行解决;管理功能缺陷:使用门槛较高,需要大量的技能来支持安装、使用、维护和调优。

作者:王玉圆

来源:IT168

原文链接:Hadoop峰会:南航航空大数据技术应用

时间: 2024-08-01 13:08:00

Hadoop峰会:南航航空大数据技术应用的相关文章

互联网大数据技术与传统行业的融合

本文讲的是互联网大数据技术与传统行业的融合,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行.来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. Hadoop中国技术峰会由China Hadoop Summit专家委员会主

学者贵于行,报名参加线上大数据技术峰会的4个理由

回顾大数据技术领域大事件,最早可追溯到2006年Hadoop的正式启动,而环顾四下,围绕着数据库及数据处理引擎,业内充斥着各种各样的大数据技术.这是个技术人的好时代,仅数据库领域热门DB就有300+,围绕着Hadoop生态圈的大数据处理技术更是繁花似锦.然而着眼当下,大数据在行业内的实际落地仍然不是件简单的事情,大数据创业成功的案例更是少之又少. 票选14个大数据案例,布道14种不同类型玩法 机器学习.增量流计算,阿里规模的技术实践 本次"大数据技术峰会"上,4位行业应用专家之外,6位

115期:在线大数据技术峰会回顾合集!

本期头条   票选最美云上大数据暨大数据技术峰会上,阿里云飞天一部计算平台高级专家无庸为大家带来题为"高可用大数据计算服务如何持续发布和演进"的演讲.本文先对MaxCompute架构进行了介绍,接着重点介绍在大数据计算服务下,高可用服务持续改进和发布的工具,包括Playback工具.Flighting工具和灰度上线.细粒度回滚等,点击查看. • [资料合集]在线大数据技术峰会:讲义PDF+活动视频! • 提速1000倍!阿里率先采用Intel Optane SSD • 东京见闻:快速走

【资料合集】在线大数据技术峰会:讲义PDF+活动视频!

回顾大数据技术领域大事件,最早可追溯到2006年Hadoop的正式启动,而环顾四下,围绕着数据库及数据处理引擎,业内充斥着各种各样的大数据技术.这是个技术人的好时代,仅数据库领域热门DB就有300+,围绕着Hadoop生态圈的大数据处理技术更是繁花似锦.然而着眼当下,大数据在行业内的实际落地仍然不是件简单的事情,大数据创业成功的案例更是少之又少. 1. MaxCompute 2.0 性能优化揭秘 演讲视频:http://yq.aliyun.com/webinar/play/188 PDF下载:h

除Hadoop大数据技术外,还需了解的九大技术

除Hadoop外的9个大数据技术: 1.Apache Flink 2.Apache Samza 3.Google Cloud Data Flow 4.StreamSets 5.Tensor Flow 6.Apache NiFi 7.Druid 8.LinkedIn WhereHows 9.Microsoft Cognitive Services Hadoop是大数据领域最流行的技术,但并非唯一.还有很多其他技术可用于解决大数据问题.除了Apache Hadoop外,另外9个大数据技术也是必须要了

Hadoop之父Doug Cutting眼中大数据技术的未来

上次见到(膜拜)Hadoop之父Doug Cutting是在2年前,2014中国大数据技术大会上.今年Hadoop10岁,刚看到他的Hadoop十周年贺词,感觉时间飞逝. Doug Cutting成长史 1985年毕业于美国斯坦福大学的Cutting并不是一开始就决心投身IT行业的.在大学时代的头两年,Cutting学习了诸如物理.地理等常规课程.因为学费的压力,Cutting开始意识到,自己必须学习一些更加实用.有趣的技能.这样,一方面可以帮助自己还清贷款,另一方面,也是为自己未来的生活做打算

除Hadoop外你还需要知道的9个大数据技术

Hadoop是大数据领域最流行的技术,但并非唯一.还有很多其他技术可用于解决大数据问题.除了Apache Hadoop外,另外9个大数据技术也是必须要了解的. Apache Flink Apache Samza Google Cloud Data Flow StreamSets Tensor Flow Apache NiFi Druid LinkedIn WhereHows Microsoft Cognitive Services Apache Flink:是一个高效.分布式.基于Java实现的

大数据技术论坛(上):Spark、Hadoop技术成主角

[CSDN现场报道]2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研.应用与产业发展为主旨的2014中国大数据技术大会(Big Data Tec就hnologyConference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕. 2014中国大数据技术大会第二日上午大数据技术论坛上,百度大数据部副总监薛正华和中国移动集团公司业务支撑系统部项目经理何鸿凌共同主持了

《深入理解Hadoop(原书第2版)》——1.2大数据技术背后的核心思想

1.2大数据技术背后的核心思想 上文中的例子我们作了诸多假设,要表明的核心问题是虽然我们可以很快地处理数据,但是从持久性的存储设备中读取的速度受到限制,这是整个数据处理流程上的关键瓶颈所在.相对于读写本地节点存储设备上的数据,通过网络来传输数据会更慢. 下面列出了所有大数据处理方法中的一些共同特征: 数据分布在多个节点(网络I/O速度<<本地磁盘I/O速度). 计算程序离数据更近(集群上的节点),而不是相反. 数据的处理尽量在本地完成(网络I/O速度<<本地磁盘I/O速度). 使用