英特尔开启大数据智慧时代

  【IT168专稿】随着不断增加的大数据解决方案需求,Apache Hadoop已经迅速成为存储和处理海量结构化和非结构化数据的首选平台之一。企业只需在少量基于英特尔® 至强® 处理器的服务器上部署这种开源软件框架,就可用较低的成本迅速开始进行大数据分析。随后可逐步将其 Apache Hadoop 集群扩展到数百乃至数千个节点,从而将多 PB 数据的查询响应时间缩短到次秒级。

  英特尔与 Apache Hadoop 社区开展协作,支持系统管理员尽可能地实现其 Apache Hadoop 集群的最高性能——同时保证复杂度处于最低限度。英特尔开发了 HiTune 性能分析器和 HiBench 基准测试套件,用它们来降低 Apache Hadoop 性能调优的复杂性,用户可以在更短的时间内更有信心地设计和实现 Apache Hadoop 解决方案。

  HiTune 性能分析器

  Apache Hadoop 的主要优势之一就是比传统数据仓库更容易部署和使用。然而,由于分布式环境的硬件与软件之间存在复杂的交互,因此要优化 Apache Hadoop 集群和工作负载以提高性能会面临重重挑战。为了应对这样的挑战,英特尔开发了 HiTune,为开发人员提供了开发高度可伸缩型应用程序的简单工具。这种可伸缩、轻量级、可扩展的性能分析器可以帮助您向客户交付性能更高的 Apache Hadoop 集群和应用程序。此外,还可以帮助您的客户在其集群的整个生命周期内获得更高的价值。

  典型的 Apache Hadoop 查询是使用直观、高级的数据流模型编写的。这对于程序员而言非常理想,因为数据分区、任务分发、负载平衡、容错和节点通信等所有繁杂的细节都由 Apache Hadoop 运行时环境来处理。然而,隐藏这种低级复杂性也会导致性能调优成为一项繁琐的挑战。因为工程师对于硬件与软件之间的低级交互知之甚少,甚至毫不知晓,而这种认识却是理解和优化性能所必不可少的前提。工程师们通常只能依靠漫长而又耗时的试错法,而结果往往也只是能得到次优的性能。

  HiTune 将监视 Apache Hadoop 集群中各服务器的关键性能指标,随后汇总这些低级指标,将这些指标与高级数据流模型相关联。这样工程师就可以获得不同任务与阶段之间动态交互的深入了解,并迅速查明拖慢性能的性能瓶颈、应用程序热点和硬件问题。

  1、简化和加速性能调优。HiTune 提供了详尽的分析和可视化,对正在运行的应用程序的性能影响微不足道,而且无需修改源代码。英特尔工程师广泛利用这种工具,在很多情况下,仅凭相对简单的硬件或软件调整就实现了高达六倍的性能收益。

  2、跨数千台服务器扩展分析。HiTune 可用于分析生产环境中跨数千台服务器运行、包含数十万个同步进程的应用程序。HiTune分析引擎可作为一个 Apache Hadoop 作业来运行,支持通过大规模并行执行海量性能数据的快速分析。工程师不需要分析在一个集群的某个部分上运行的部分应用程序,而是可以收集和分析完整的信心,获得更有用的洞察。

  3、逐渐获得更高的价值。英特尔将继续为 Apache Hadoop 和其他分布式大数据解决方案扩展并优化 HiTune。英特尔已经利用 HiTune 调优和优化了 Apache Hive 的性能,Apache Hive 是基于 Apache Hadoop 构建的开源数据仓库。您现在积累的调优专业经验会在未来交付更高的价值。

  HiBench 基准测试套件

  随着市场的发展,随着客户开始以接近实时的方式利用大数据洞察力来提高收入流、盈利能力和经营效率,优化和验证 Apache Hadoop 集群的性能变得更加重要。利用 HiBench 基准测试套件,您可以跨不同的工作负载准确而又一致地度量、验证和对比 Apache Hadoop 集群的性能,为客户提供更出色的信息和信心。

  HiBench 提供了对 10 种易于使用的 Apache Hadoop 工作负载的便捷访问,这些工作负载经过扩展、配置和定制,能够反映典型的部署。您可以为特定的通用任务度量性能,例如排序和文字计数,或者为更加复杂的实际应用度量性能,这些应用包括 Web 搜索、机器学习和数据分析。不同的工作负载具有不同的特征,使您能够建立测试矩阵,体现特定环境的资源需求。

  英特尔将继续扩展和改进 HiBench,还会与领先供应商和标准实体联手协作,开发针对 Apache Hadoop 的行业标准性能基准测试。建立这些基准测试之后,您就具备了理解架构问题、度量和验证 Apache Hadoop 解决方案性能的更好基础。

  构建一个经过验证的基础

  设计全面优化的 Apache Hadoop 集群需要深入理解整个解决方案体系。可能要投入数月的时间来探索 Apache Hadoop 工作负载特征,并了解如何与底层硬件和软件交互。还可以利用英特尔多年来与目前运行某些全球规模最大、最成功的 Apache Hadoop 实现的企业之间共同研究和协同使用所得到的专业经验,这些企业包括 Google、Yahoo! 和某些顶尖的电信与金融服务企业。

  英特尔将这种专业经验构造成为参考架构、调优指南和最佳实践建议,可以将它们用作设计和部署 Apache Hadoop 集群的起点。利用从硬件规范直至完整软件架构的明确指南,可以更迅速、更经济地设计、构建和配置最适宜的解决方案。

  还可以在多种领先 Apache Hadoop 发布版中任意选择,所有这些发布版均已针对英特尔至强处理器而高度优化。英特尔与 Cloudera、Hortonworks、IBM 和其他商业经销商合作,确保运用的是已专门针对企业环境中的生产就绪性而进行扩展、加强和测试的软件,在英特尔架构上实现最优性能。

时间: 2024-09-22 21:24:01

英特尔开启大数据智慧时代的相关文章

英特尔:大数据产生新生态环境

云计算.大数据为整个生态系统都带来很多机会,英特尔公司以非常开放的模式,希望和产业链一起合作取得共赢. "目前是IT业大变革的时代,因为大数据.云计算这两个加一起,是IT行业目前看到的最大变革.我称之为信息化2.0版,如果搞定了,全球都会出现质变."英特尔中国首席工程师.数据中心软件部CTO苗凯翔博士表示. 实际上,英特尔虽然主要致力于芯片底层技术,但在云计算.大数据以及软件方面,英特尔也做了大量的工作.苗凯翔博士介绍,全球最新的统计,全球在建云系统中有94%的市场份额都采用英特尔处理

英特尔让大数据“接地气”:Hadoop从架构做起

当大数据成为常挂在口边的一个词,那么,接地气就显得尤为重要.英特尔将大数据解决方案英特尔Hadoop发行版软件最先发布在中国,并在通信等行业得以实施,更要紧的是,英特尔为ISV.应用软件供应商在大数据上的实施带来了便捷. 中国是大数据的最佳实践地 由于中国市场容量大,所以,大数据在中国有非常好的发展环境.英特尔在大数据领域的探索,中国区处在全球的前列.去年,英特尔在中国就已经有一些典型的案例实施,去年三季度在国内发布了大数据解决方案英特尔Hadoop发行版软件,全球市场直到今年2月才发布,已经领

微软开启大数据平民化时代 每个人都能当Mr.Big

我们的城市中有一位Mr Big,他是如此的巨大以至于拥有改变世界的力量,他能够看到正在发生的一切,能够预知将要发生的未来,帮助我们创造动人的惊喜,它能够看到发生的一切--有了大数据,谁都可能成为Mr.Big. 图为微软全球高级副总裁,大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)在微软大数据战略发布会上演讲 上面这段话摘自昨天微软在北京发布其大数据战略时现场播放的一个短片,这个短片形象.直观地展示了大数据的魅力所在.与其他厂商不同的是,微软大数据战略强调利用简单的工具来实现大数据

英特尔助力大数据生态系统构建

英特尔助力大数据生态系统构建 程从超 英特尔中国云计算创新中心 --云计算与大数据的理解 --大数据建议方案 --英特尔助力云数据中心建设 英特尔助力大数据生态系统构建

戴尔开启“大数据+”主题盛宴

引言 贵阳再发英雄帖,各路大数据专家共赴大数据盛宴.2016数博会以"数据创造价值, 创新驱动未来"为主题,发声全球将再次打造大数据行业盛宴.整体定位"国际化.专业化.高端化.可持续化"成为具有权威影响力的"国家级"盛会. 在未来5年到10年,中国大数据产业将迎来黄金增长期.2015年中国大数据市场规模达到115.9亿元,增速达38%,预计2016年至2018年将维持40%左右的高速增长--大数据究竟可以为我们的生活带来哪些改变?来数博会戴尔展台

英特尔:大数据与隐私的问题关键在于寻求平衡点

大数据已经在推进教育.市政以及医疗等事业的丰富性方面表现出巨大的潜在能量,且仍在进一步延伸到我们生活当中的各个垂直领域中来. 不过要让这一切真正转化为现实,就要求每个人以开放性的心态迎接此类创新趋势--反过来,这也需要大数据具备值得信任的安全水平,英特尔公司全球隐私官David Hoffman解释称."我们所探讨的并非隐私或者进展--我们讨论的是隐私与进展,二者缺一不可,"Hoffman认为. 英特尔在大数据隐私领域的一大努力方面在于鼓励企业用户接受"数据创新承诺,"

感知环境、智慧环保——开启生态环保大数据智慧时代

[导读] 基于"共性平台+应用子集"的建设模式,对环境要素.污染排放要素及环境风险要素进行全面感知和动态监控,建设全向互联的新型生态环境监测监控物联网体系,探索出可复制的环保物联网建设.运营及运维的市场化和社会化模式,达到国内领先的示范效应. "感知环境.智慧环保"无锡环境监控物联网应用示范工程作为国家环保部环保物联网应用示范项目.国家发改委物联网示范项目.国家工信部物联网专项资金支持重点项目,贯彻"物联网+环保"的建设思路,融合大数据.云计算等

贵州开启大数据新时代

日前,贵州在京举办2016云上贵州·大数据招商引智推介会暨贵州大数据发展成果展,集中展示了贵阳大数据综合创新试验区建设.云上贵州系统开发.围绕大数据的创业创新等方面取得的成果.现场集中签约产业类.人才类.科研类.数据资源类等项目30个,投资总额222.38亿元.2014年以来,贵州省将大数据作为全省经济社会跨越发展的重大战略选择,高位起步.发展迅速.风生水起,在全国形成了先行优势. 贵州省把发展大数据产业作为弯道取直.后发赶超.同步小康的现实路径,作为统领全省各领域的主要牵引和重要支撑.贵州省主

英特尔投资大数据对手 成Cloudera最大股东

http://www.aliyun.com/zixun/aggregation/17197.html">北京时间3月28日消息,据路透社报道,英特尔周四宣布,已对大数据创业公司Cloudera进行了大笔投资.该交易将使得英特尔成为Cloudera最大股东. 英特尔表示,入股Cloudera是英特尔史上最大一笔数据中心技术投资,这笔股本投资将使其成为Cloudera最大单一战略股东.该芯片巨头按照协议,英特尔将获得一个Cloudera董事会席位.外界普遍预计,Cloudera将在今年上市.