英特尔段建钢:Spark将成为下一代大数据的标准

Spark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Spark由加州伯克利大学AMP实验室Matei为主的小团队使用 Scala开发开发,其核心部分的代码只有63个Scala文件,非常轻量级。 Spark提供了与Hadoop相似的开源集群计算环境,但基于内存和迭代优化的设计,Spark在某些工作负载表现更优秀。

9月18日,在长沙举办的第九届政企信息化策略研讨会中,来自英特尔的高级技术经理段建钢带来了“大数据技术发展剖析”的主题演讲。Hadoop改变了处理数据方式,但相较于Hadoop,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越。

英特尔的高级技术经理 段建钢

段建钢指出,当前很多人都在谈论大数据,但如何落地这是个问题,用户关心的往往是如何用大数据解决业务上的问题。而如何运用大数据就需要从底层基础设施,到上面数据平台、分析能力和解决方案,这一系列环节的优化。

英特尔推出了Apache Spark,为Hadoop集群带来了速度极高的内存内分析能力,从而将大规模数据集的处理周期由几小时成功缩短为几分钟。目前英特尔和优酷合作,帮助优酷将传统业务迁移到Spark上,优化大数据分析,分析时间从40个小时缩短到3个小时以下。

“Spark会成为下一代大数据的标准。”段建钢说道。未来英特尔将与技术界、学术界一起推动生态系统的发展。

Cloudera解决方案架构师陈建忠指出,1980年代企业应用以流程为中心,并包含以结构化数据为主、只包含内部数据以及只包含“重要”的数据三大特点。而到了当今时代,数据变成信息为中心的企业使用的所有数据,以及包含内部和外部数据的所有类型的多层结构。

Cloudera解决方案架构师 陈建忠

Cloudera进入中国以来,在金融、高校、气象等领域拥有了多个成功应用案例,帮助客户实现基于统一的平台和数据进行多样化的自助分析,改善客户的服务能力和服务效率,大大节约了投资成本。此外,Cloudera致力于加速Spark的社区开发和提高企业部署,从管理、安全、规模和数据传输等方面让Spark和Hadoop生态进行更广更深的融合。  

原文发布时间为:2016-7-14

 

本文作者:孙博

时间: 2024-09-18 00:12:06

英特尔段建钢:Spark将成为下一代大数据的标准的相关文章

Intel亚太研发有限公司段建钢:存储市场的那些年

2016年8月5日,全球开源领导厂商红帽携手ZD至顶网.Intel.云达科技共同举办的主题为"开放 融合 开源开启存储新世界"的2016年中国开源企业存储峰会在北京富力万丽酒店隆重召开.Intel亚太研发有限公司云与大数据科技中心资深工程经理段建钢出席此次峰会,并做主题为"存储革命"的精彩演讲. 段建钢先生表示,"我们正处于信息爆炸时代,处在大数据与积极学习.深入学习的蓬勃发展时代,也是变革的时代.正是市场的快速变化,为我们带来了更多的挑战和机会.&quo

Hadean完成260万美元融资,将颠覆 Spark、Hadoop等大数据框架

众所周知,利用算法分析不同规模的数据量时所需要的服务器资资源是不一样的 .许多企业在做大数据分析时,尤其是数据量非常庞大时,所需要的服务器资源仍是一笔无法避免巨大开销. 然而一家来自伦敦的公司近期声称他们创新型的解决了这一难题,他们的解决方案将在无须占用任何工程资源的前提下用算法对任意规模数据进行运算与分析. 听起来虽然不可思议,但资本还是用真金白金给出了回复.伦敦的Hadean今日完成了260万美元的种子轮投资,投资方为White Cloud Capital 和 Entrepreneur Fi

英特尔Management Engine被发现在设备休眠时接受数据包

我们使用的硬件有很多秘密.其中之一是英特尔的Management Engine(IME),它是一个协处理器,与主芯片集成在一起,如何工作外界所知不多,它是底层安全的一部分.IME被发现总是在监听请求,在设备休眠时也会接受数据包.这一发现可能会产生某种阴谋论. 英特尔需要让IME的工作变得更透明.AMD的处理器上也有类似的硬件,叫Platform Security Processor,使用的是一个ARM核心,ARM相比其它平台要透明开放得多. 本文转自d1net(转载)

英特尔陈荣坤:移动端芯片功耗大是误解

腾讯科技 宗秀倩 2月26日 巴塞罗那报道从CES2013,到MWC2013,英特尔在各大展会不遗余力推广自己的移动平台解决方案.今年的 世界移动通信大会(MWC2013)上,高通和英特尔的展台都在3号馆,仅有一个过道之遥.于遥遥相望之间,老牌芯片厂商英特尔在移动通信芯片领域 成了"追赶者".此次MWC上,英特尔发布了包括面向智能手机和安卓平板电脑的双核凌动系统芯片"Clover Trail+"平台,英特尔还披露了下一代凌动系统芯片的研发代号为"Bay T

英特尔76.8亿美元收购McAfee IT进入大变革时代

[CSDN 综合报道]北京时间8月19日晚间消息,英特尔发布新闻稿,称已决定现金收购著名安全软件开发商McAfee公司,收购价格是每股48美元,比McAfee的周三收盘价29.93美元高出60%,而交易总价更达到约76.8亿美元.如此大规模收购一家软件公司,在英特尔42年公司历史上极为罕见. 收购后,McAfee将作为英特尔软件与服务集团的全资部门,该部门现在由英特尔高级副总裁Renée James(女)率领. 英特尔表示,该公司目前的安全服务不足以覆盖手机.电视.ATM以及其他可与网络连接设备

Hadoop+Spark+MongoDB+MySQL+C#大数据开发项目最佳实践

随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务.目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值.为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则.知识,并基于这些信息构建专业的临床知识库,提供诊断.处方.用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度.   二.Hadoop&Spark  目前大数据处理领域的框架有很多.   从计算的角度上看,主要有MapRed

如何设计基于Hadoop、Spark、Storm的大数据风控架构?

量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品"信用钱包"帮助个人用户展示经济财务等状况,撮合金融机构为用户提供最优质的贷款服务.金融的本质是风险和流动性,但是目前中国对于个人方面的征信行业发展落后于欧美国家,个人消费金融的需求没有得到很好的满足.按照央行最新数据,目前央行征信中心的数据覆盖人口达到8亿人[1],但其中有实际征信记录的只有3亿人左右,有5亿人在征信系统中只是一个身份证号码.此外,我国还有5亿人跟银行从来没有信贷交易关系,这5亿人对金融部门来

戴尔软件调查结果显示中型企业正积极实施大数据项目

ZDNet至顶网服务器频道 04月29日 新闻消息:作为一个经久不衰的炒作主题,大数据已经被视为大型企业机构的专属,而非中型企业面临的挑战或机遇.然而,戴尔软件针对中端市场大数据计划所做的调查结果却截然相反.大数据计划,曾经只是大型企业独有的优势,正在以新的分析工具不断加强IT部门领导与公司业务之间的联系,帮助中型企业机构改进产品质量和决策. 为了寻求推动中端市场采用大数据项目的原因所在,戴尔软件委托Competitive Edge Research 对全球中型企业高管进行了一次调查.着眼于中型

Spark点燃近实时大数据之火

在用户体验达不到所宣传效果之后,IT领域中必然会随之出现"新的热门事件".目前的新热门事件涉及大数据和对海量分布式数据的快速精准分析. 在目前的大数据领域中,Hadoop被作为存储和分配海量数据的软件,而MapReduce则被作为处理这些海量数据的引擎.两者整合在一起可以批处理一些对时效性没有过高要求的数据. 那么对于近实时大数据分析应当怎么办呢?作为最先进的下一代开源技术Apache Spark已经为视频.传感器.交易等流数据的分析.机器学习.预测建模创造了条件.它们可以用于基因组研