DTCC2015:大数据行业应用及开源架构

文章讲的是DTCC2015:大数据行业应用及开源架构,以“大数据技术探索和价值发现”为主题的第六届2015中国数据库技术大会(以下简称大会)近日在京召开。大会吸引了近2500名技术爱好者参与,活动主办方除设置主会场外还开设了多个专场,在《专场19:大数据-商业与开源架构》上来自中海纪元数字技术公司技术总监任广坤,携程网高级架构经理赵俊,搜狐DBA赖亿,博晓通联合创始人董健将为我们带来一场精彩的大数据全方位的知识“盛宴”。


▲中海纪元数字技术公司技术总监任广坤

  中海纪元数字技术公司技术总监任广坤首先介绍了大数据在智慧政务上的应用。他指出,在云计算已经遍布国内大江南北,各地都在建设云计算基地能够为大数据应用奠定基础。再说电子政务的发展,它与我们的生活是密切相关的,回顾整个电子政务的发展经历来看,它主要经历了几个阶段:

  第一个阶段90年代左右其信息化是垂直的系统;第二阶段是从2000年到2005年是两网一站,四库十二金的应用;第三阶段是从2006年到2011年,面向业务协同提高办事效率主要推是标准化市民中心。第四阶段从2012年以后政务向是一站式智慧政务。所谓一站式主要是基于云计算、大数据等提供的服务。


▲新技术带来的行业变化

  任广坤指出大数据带来了行业的变革,给政府行业大数据带来了六大转变:从粗放管理向精细化转变,从单相管制向政民互动转变,从各自为战向协作共享转变,从被动响应向主动预见转变,从行政主导的政府向以人为本服务型政府转变,从经验决策向基于大数据的科学决策转变。


▲业务新要求、IT新需求推动统一化

  谈到电子政务的应用,其实电子政务与企业的架构有很高的相似性,过去企业建了很多的IT系统,形成“烟筒”式的架构,这些问题不仅仅是企业面对,对于电子政务而言,同样也面临相信的问题比如当有了新的业务需求时,同样也对IT提出了新的需求,这就要求必须统一化。以政务数据为例,政务的需求是纵向访问上级部门,纵向各业务之间要隔离,要求数据需要更强的稳定性、安全性、可靠性。 大数据是政务资源整合和业务协同的重要组成部分,对于政务的需求推荐使用面向电子政务领域的EDATA平台,它是基于大数据的采集、存储、分析与挖掘及可视化展示应用等全方位一体化解决方案,基于开放性架构的平台,可面向电子政务各行业应用进行具体业务需求快速实现。


▲平台系统架构设计


▲平台设计理念


▲平台设计功能

  携程高级架构经理赵俊就《应用与DB的实时依赖分析与故障定位》作了主题分享。他指出,当网站访问量越来越大的时候,对于DB是一个“灾难”,大量报错需要花很久的时候才能定位。基于此,携程开发了DAP。DAP(Data Arch Portal)是基于Java开发的, 使用12种开源框架的实时应用与DB监控平台。它为携程提供了从架构到应用访问DB的全面监控服务和决策支持。


▲携程高级架构经理赵俊

  现在DAP的现状是拥有16台物理监控肌群,1500+业务应用(包括.net,Java,和MS SQL),4000+应用服务器,>10TB消息大小,>100亿消息(每天),单机Max QPS 10w/S(生产环境)。一套好的监控系统指标不仅要具备对应用无影响,还能够具备实时性、吞吐量、开销低、可靠性、服务端处理100%的到达消息等元素。


▲DAP报表之系统报错大盘


▲DAP报表之应用与DB耦合依赖


▲DAP报表之架构总图

作者: 李伟

来源:IT168

原文链接:DTCC2015:大数据行业应用及开源架构

时间: 2024-10-14 00:43:05

DTCC2015:大数据行业应用及开源架构的相关文章

大数据行业2016的变与不变

据<中国科学报>报道,"这两年大数据的风头明显盖过了云计算,这不是好事."近日,华为IT产品线大数据解决方案规划总监徐兴海在2015中国大数据技术大会上如是说.他认为,云计算已过了炒作期,在公有云的带动下实现了规模化落地,"已经开始赚钱了":而在去年,大数据的发展还在泡沫的破灭中,今年大数据已开始有走入应用的"苗头","而不仅仅是炒作". 除了从"炒作"到走向"泡沫的幻灭",

2014中国大数据行业大调查首批获奖名单大曝光

在2014中国大数据技术大会召开前期,CSDN特举行了"2014中国大数据行业大调查(2014年11月7日 - 2014年12月7日)"活动,旨在为大数据技术从业者和创业者们提供一个合理的参考.而在活动进行的两周内,我们得到了来自全国各地数百位CSDN小伙伴的支持. 那么,究竟是什么吸引了全国如此多小伙伴的踊跃参与?这里我们不妨看向本次2014中国大数据行业大调查的一等奖: BDTC 2014之旅 本届大会将持续三天,大会第一天也就是12月12日,将举办第二届CCF大数据学术会议论文宣

大数据行业图谱(2):前有堵截,后有追兵,通用技术类公司如何突围

从2011年至今,大数据概念火了五年,势头依然不减.从人人都在讲概念,到商业化应用典型案例出现,可以清晰地看到大数据在逐步落地.以Hadoop为代表的底层架构日趋成熟,处理数据的各项技术有了长足的进步,让大数据开始在各个领域发挥价值. 我们认为,大数据产业仍在初级阶段,商用价值仍未完整展现,市场前景一片广阔.一方面,国内企业IT投入占比低于全球平均标准,随着企业对信息化意识逐步提升,整个IT市场的蛋糕有望继续做大. 另一方面,企业客户将大量IT预算投入到云计算等基础设施建设上,随着基础设施逐渐成

大数据行业图谱之一:底层基础平台公司能做多大?

底层基础平台主要解决的是数据存储.计算的问题,是整个大数据生态的基石.采集到的数据,首先要能高效.快捷地存起来,才能进行数据分析和数据挖掘. 这一层非常重要,同时也是技术含量最高的一层.以底层技术中明星Hadoop为例,用Hadoop的公司很多,能做Hadoop发行版的公司凤毛麟角. 底层基础平台细分领域里的大数据公司众多,有专注Hadoop发行版的星环科技.红象云腾和天云大数据,有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库,还有唯一来自中国的Apache社区顶级项目K

调研分析了685家国际大数据公司,解答大数据行业的发展和机会

随着国内互联网+影响力在传统行业的不断渗透,大数据作为贯穿互联网产品整个设计.营销.销售.客服.到运营全流程的底层核心地位在国内市场也慢慢成熟.但是纵观全局,中国的2B企业生态和大数据的落地应用还是落后于美国的整个行业的. 本文通过调研分析了685家国际的大数据公司来回答几个问题: 1)目前大数据行业的核心收入来源来自哪里? 2)除了现状的收入投资界是怎么看的,他们最近的投资风向在哪里? 我们将大数据行业划分为分析层,应用层,基础架构层,数据源,开源工具,架构和分析交叉类,以及孵化器和教育共7个

大数据行业图谱之(1):底层基础平台公司能做多大?

大数据是企业服务市场中的新兴领域,短短几年时间,大数据概念从兴起到落地,开始在各行各业发挥作用,行业政策频出,技术飞速发展,受到资本追捧. 整个大数据行业可大致分为三层,底层基础平台,中间层通用技术,上层行业应用.接下来,爱分析将按照上述分类,逐步介绍各细分领域的行业现状.未来前景.今天是大数据系列的第一篇--底层基础平台. 底层基础平台主要解决的是数据存储.计算的问题,是整个大数据生态的基石.采集到的数据,首先要能高效.快捷地存起来,才能进行数据分析和数据挖掘. 这一层非常重要,同时也是技术含

再谈大数据行业里的两大误区

之前在虎嗅发了一篇文章<大数据行业里的两大误区>,很多朋友评价还不错,受此激励,结合最近目睹.经历的项目,想多写一些.经过笔者总结,发现大数据的误区还真是不少,尤其是国内,很多人以讹传讹,造成了很多基本概念的偏差.接上一篇文章,再来谈谈大数据中的一部分误区,供大家拍砖. 误区三:数据量特别大才叫大数据 在 "数据界"存在这样有一波人,他们认为"只有Peta级以上的才叫大数据,甚至到了Zeta以上才叫大数据,目前还没有到真正的大数据时代!",每次听到这样的

强烈推荐!大数据领域的顶级开源工具大集合

随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显. 如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析.借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡. 以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储.开发平台.开发工具和集成.分析和报告工具. 数据存储: Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt NoSql 数据库 – M

大数据行业5个职位方向指南

大数据已不再是新词,企业也越来越需要大数据高端人才.这给想要从事大数据方面工作的人员提供了难得的职业机遇.那么在大数据行业,都有什么职位可以选择呢?来看看大数据行业的5个职位方向指南吧! 一.ETL研发 随着数据种类的不断增加,企业对数据整合专业人才的需求越来越旺盛.ETL开发者与不同的数据来源和组织打交道,从不同的源头抽取数据,转换并导入数据仓库以满足企业的需要.ETL研发,主要负责将分散的.异构数据源中的数据如关系数据.平面数据文件等抽取到临时中间层后进行清洗.转换.集成,最后加载到数据仓库