从传统架构到云上数据,发生了哪些转变

 【51CTO.com原创稿件】在数据时代的今天,如何部署企业的大数据平台,充分挖掘数据、分析数据、发挥数据价值,成为摆在企业面前的重要难题。面对爆炸式增长的数据,传统的数据分析平台存在着诸多的问题,已经不能满足需求,借助云计算实现的云上数据分析平台,就能够非常灵活、轻松的实现企业的各种数据分析需求,并能够有效控制成本。这里,笔者就与大家简单的聊一下从传统架构到云上数据,到底发生了哪些转变。

首先,来分析一下传统数据分析平台存在的各种问题。

传统大数据分析平台面临的主要挑战

一)多租户支持。从Hadoop出现的第一天起,对于多租户的支持一直是大数据里被诟病的重要一点。如何在一个Hadoop集群做多租户,由此提出了做队列调度等等一大堆解决方案,但真正落地的并不多。如果把大数据拆成多个集群,拆完后失去了资源复用的意义,但是如果把所有数据放到一个大的集群中,又无法保证数据安全。因此,在传统数据分析平台中多租户的支持一下是老大难。

二)快速部署。企业在建设大数据平台时需要采购很多设备,对于人员的技术要求非常高,快速地推向市场将面临很大的风险。

三)系统的灵活性和可靠性。传统大数据平台想要实现扩容,操作起来非常麻烦。例如计算能力不够时需要扩容,采购机器至少需要花费几周的时间,而要真正投入到使用当中,时间就会更长。

英特尔技术专家在接受笔者采访时曾表示,大数据分析平台要综合考虑效率、成本和数据安全,传统的数据分析平台无论从哪个方面来讲,都已经无法满足企业对数据分析的需求,而云计算平台则能够很好的解决这些问题。

硬件革命使大数据和云计算紧密结合

众所周知,在2011年Hadoop刚开始流行的时候,整体硬件的性能非常低,网络仅有一千兆,硬盘每秒钟磁盘的IO水平非常低,写只有每秒50次左右,读是每秒钟100到300次,计算能力也不强。6年之后,硬件性能发生了翻天覆地的变化,CPU计算能力提升了10倍、20倍,存储从每秒钟50次写的次数提升到每秒钟写次能上50万,I/O的性能有一万倍的提升,网络从千兆网到40G、100G,也有100倍的提升。正是这种硬件性能的革命,使得Hadoop的设计理念发生了一些变化。

之前在利用Hadoop做大数据分析时,由于硬件性能差,挪动数据的成本太高,所以只能挪算法,数据在哪我们就在哪里算。随着硬件性能的提升,让我们能够把存储和计算分开。根据客户的实际需要,将计算集群和存储集群分到两个独立的集群,通过高速互联网链接起来,这实际上就是成本和效率之间的折中。此外,为了保证多租户,保证灵活性、安全性,将存储网络和计算网络分开,在存储网络内,比如对象存储,可以通过Amazon S3,restful等接口访问数据,从而实现多租户。同时,在计算集群里通过虚拟化、容器,实现多租户,按需调度。两个集群分开,完全可以满足用户的部署问题、安全问题。此外,硬件的革命使得大数据+云计算成为可能,等于Big Data As a Service。

云上数据,更加灵活、易管理

虽然说云计算在大数据里面不是必须的,但是没有云计算这个轮子,大数据里面所谓的按需分配、多租户、灵活扩展、动态配置都是不可能的;而如果我们要达到一个成本和可管理性、灵活性的一个折中,云计算是必须的。所以结合在一起就是云上的大数据,从而实现存储集群和计算集群的分离。

英特尔技术专家表示,在系统的存储层面上,包括块存储、对象存储、第三方存储,把各种存储形成一个独立的、软件定义的SDS(软件定义存储),灵活地在存储层面上做多租户、自动化、灵活性。在计算层面上,通过虚拟机、容器等技术,实现多租户,灵活地配置各种服务,把大数据做成多种服务。这样,用户能够按照自己的需求来动态选择、动态扩容,实现两层分开。当然,对于SDN来讲,可以用传统的网络,用10G、40G、100G的进行链接。对于互联网企业来讲,直接用软件定义网络即可。

例如英特尔与金山云合作的KMR计算,数据放在块存储还是放在对象存储上,实际上是有不同的配置来实现的。用户想节省成本,想成本最低,都是批处理,这时候可以把数据全放在底层对象存储,用KS3做对象存储,当需要计算的时候,Spark直接从对象存储调用数据计算。同样,如果用户想保证效率,对计算的实时性要求很高,这时可以在内存里面建立一个内存文件系统,把热数据全部缓存在内存里面,直接用KML或者是Spark实现内存计算,保证查询的实时性和计算的实时性。

写在最后:从传统的架构到云上大数据,实现了很多的转变。传统的大数据平台计算和数据一般都在一起,到云上之后计算有可能是虚拟机、有可能是容器,存储和计算是分离的。任何计算节点访问存储时都是通过高速互联网络把数据迁移到本地来。实现的优势也就是大数据的服务化,灵活配置。因此,借助强大的计算性能,结合云计算平台的优势,从传统架构的大数据平台向云上数据的转变,将给用户提供更高的灵活性和管理性,并能够为用户节省大量的成本。

 

 

者:ZC

来源:51CTO

时间: 2024-08-31 10:09:12

从传统架构到云上数据,发生了哪些转变的相关文章

传统架构下的上云之路——来伊份上云历程分享

摘要:本文的整理自2017云栖大会-上海峰会上来伊份CIO张爱军的分享讲义,讲义主要分为三部分,首先是来伊份的介绍,来伊份,是集线下门店+线上电商+移动支付app一体化O2O全渠道休闲食品品牌和销售平台运营商,其次是上云历程,最后讲了上云之后面临的问题. 在2017云栖大会-上海峰会上,来伊份CIO张爱军做了题为<传统架构下的上云之路--来伊份上云历程分享>的分享.来伊份17年的匠心品质提供给全社会消费者安全美味健康的休闲食品坚持领鲜到底的产品理念,甄选全球20多个国家和地区.全国22个省市健

如何在ECS上搭建Oracle?Oracle云上云下6种架构全解析

在2016杭州云栖大会第二日,袋鼠云联合创始人丁原在飞天服务专场分享了<EasyDB for Oracle--基于阿里云的Oracle最佳实践>.他主要从云上Oracle可行性分析.云上Oracle数据库架构.EasyDB for Oracle三个方面进行了分享,详细介绍了Oracle传统架构.云下(传统)经典数据库架构.Oracle云上4种架构的实现和优缺点. 以下内容根据演讲PPT及现场分享整理. 可行性分析 数据库关注点 不管是线上还是线下,数据库应该关注什么?第一,性能好坏.第二,数据

韵达:首家物流云企业的大规模云上调度实践

本文正在参加"最佳上云实践"评选,来给我们投票吧:https://yq.aliyun.com/activity/158(编号3) 在2015年12月29日,菜鸟推出了中国首个物流云平台,韵达成为首家战略合作伙伴,也是国内首家业务系统全面上云的快递企业. 所谓物流云,是一个基于云计算的物流基础信息服务平台,它能提供安全稳定的云设施环境,帮助快递企业和物流订单涉及所有链路成员建立连接.沉淀大数据,并在此基础上提供多样化的智能产品. 上云过程 下图是韵达上物流云的整个进度. 刚开始讨论是否上

【云端起舞】Oracle云上一键安装数据库补丁集

编辑手记:为数据库升级打补丁是一项常规的任务,在通常情况下 ,打补丁是一件繁琐的事情,需要考虑的细节比较多.但在云上,可以通过按钮一键式应用 相关补丁集,高效便捷.我们今天一起来学习 Oracle Cloud Database Patching Then patch like a king with single click Database As A Service (DbaaS)  系列文章回顾: 1.Configure and Practice Backup and Recovery in

余额宝与天弘基金 如何在”云”上缔造千亿元神话

仅仅一年内,天弘基金就从一个排名靠后的中小基金公司,跃居行业老大,一举取代位居老大位置7年之久的华夏基金,成为基金管理规模最大的基金公司,总规模已达到5862亿元.在余额宝上完成基金销售神话的天弘基金,究竟如何缔造了其发展神话? 来自天弘"增利宝"8月26日发布的2014年半年报显示,截至6月底,余额宝总规模已达5741.6亿元,用户数已达1.24亿户,为用户创造收益125.48亿元:半年内余额宝对接的天弘增利宝货币基金规模增加了3888亿元,使该公司半年规模增幅达到2倍.仅仅一年内,

让云上比云下更安全 阿里云说有能力把安全做到极致

10月12日,杭州云栖大会上,阿里云安全事业部总经理肖力,对日前发布的企业云安全架构,逐层解构,并介绍了阿里云如何从平台.数据.服务三个维度,为云上客户,和未来所有上云企业,提供极致的安全. 表象:安全,可能成为企业发展的黑天鹅 当企业处在数字化转型的拐点,安全问题很可能阻碍企业弯道超车.今年,三起严重的安全事件,无一不在提醒企业,安全的重要性. 从美国三大征信公司之一的Equifax数据泄露,股价下跌30%,CEO.CTO引咎辞职: 到横扫150个国家.30万终端的WannaCry蠕虫病毒,再

阿里云面向企业效率的云上产品全解析——云AP

可靠与划算并重,稳定与智慧的化身 2017年10月12日的杭州云栖大会上,阿里云副总裁李津做了"云之深处"的阿里云新品发布主题演讲,在演讲中,李津认为在数字化时代,商业的效率将指数级提升,而智能技术的发展,也将给企业与客户的交互带来巨大的变化,为了帮助企业在数据化时代领跑商业前沿,阿里云推出了面向企业效率的云上产品栈,云AP,就是其中的一个重要产品. 阿里AP是基于云和大数据平台整合的新一代具有颠覆性意义的无线网络体系产品,产品面涵盖了企业级 Wi-Fi 管理.大数据服务等内容,是第三

云上的数据安全,是企业互联网化发展的生命线!

云计算.大数据.人工智能.VR.AR.芯片技术.IoT.移动互联.生物识别.金融科技.智慧物流.机器人--渗透融入人们的吃饭.穿衣.消费.住行,一派"一切可编程,万物皆互联,数据定义一切"的科技新景象. 当人们的生活,组织的发展,以数据为驱动时,当安全的防线被突破,科技的诟病也伴随而来.   人脸识别让我们在享受刷脸通行的便利同时,必然面临着模仿和复制: 人们在享用智慧医疗搭建起的医疗环境的同时,心脏起搏器遭到攻击可能给人类生命带来致命的打击: 智能家居无人驾驶,解放人类双手的同时,黑

架构分析、数据整合、负载均衡,梦想旅行解析云上实践

全面赋能,双11电商解决方案上新,全新75折:https://www.aliyun.com/solution/ecommerce/act/huhang1111 9月23日由阿里云主办的第三期<电商大咖直播:备战双11最佳实践>线上分享圆满结束,来自梦想旅行的CTO李帅分享了如何在大数据的云上实践过程中来把畅行全球的事做的更完美,主要介绍了分布式爬虫架构.数据整合与知识发现.遇到的阻碍.高可用与容灾. 本次视频直播的整理文章整理完毕,如下内容. 如何能够让云计算更好的帮助行业的发展.更好的服务行