Hadoop参考设计的实现及性能:Hadoop性能初步测试

  Name Node/Second Name Node 规格(共两台服务器):

  

  DataNode/">TaskTracker 规格:

  

  机柜规格:

  

  Hadoop 性能初步测试

  基于上述所建立的Hadoop集群,使用标准测试组件进行方案验证,并使用Hadoop性能标杆套件HiBench进行性能测试。

  nnbench

  测试目的:对NameNode的硬件及配置进行负载测试。

  参数设置:

  maps = 12

  reduces = 6

  测试命令

  在hadoop安装目录(一般为/usr/lib/hadoop/)下输入:

  [root@hadoop3 hadoop]# hadoop jar hadoop-test-1.0.3-Intel.jar nnbench -operation create_write -maps 12 -reduces 6 -blockSize 1 -bytesToWrite 0 numberOfFiles 1000 -r eplicationFactorPerFile 3 -readFileAfterOpen true

  测试通过准则:

  在命令执行过程中没有报错。

  Sort

  测试目的:测试整个MapReduce系统的性能。

  参数设置:

  测试命令:

  第一步在一个目录中生成随机数据:

  hadoop jar hadoop-examples-1.0.3-Intel.jar randomwriter random-data

  第二步调用排序程序:

  hadoop jar hadoop-examples-1.0.3-Intel.jar sort random-data sorted-data

  第三步检查第二步输出的结果已被正常排序:

  hadoop jar hadoop-test-1.0.3-Intel.jar testmapredsort -sortInput random-data -sortOutput sorted-data

  测试通过准则:

  在第三步执行完后输出:

  SUCCESS! Validated the MapReduce framework's 'sort' successfully.

  TestDFSIO

  测试目的:测试HDFS的I/O性能。系统使用MapReduce同时读写文件。

  参数设置:

  nrFiles: 10

  fileSize: 1000

  测试命令:

  hadoop jar hadoop-test-1.0.3-Intel.jar TestDFSIO -write -nrFiles 10 -fileSiz e 1000

  测试结束后会输出以下结果:

  ----- TestDFSIO----- : write

  Da te & time: Thu Ma y 09 03:01:56 CST 2013

  Number o f files: 10

  Total MBytes processed: 10000

  Thr oughput mb/sec: 92.87206872533086

  Average IO rate mb/sec: 98.6314926147461

  IO rate std deviation: 23.668972646690577

  Test exec time sec: 47.991

时间: 2024-11-05 18:52:14

Hadoop参考设计的实现及性能:Hadoop性能初步测试的相关文章

Hadoop参考设计的实现及性能:HiBench性能测试

该工具在业界引起巨大反响.总结该成果的发表论文The HiBench benchmark suite: Characterization of the MapReduce-based data analysis[]被广泛引用,仅国际权威学术期刊http://www.aliyun.com/zixun/aggregation/14477.html">IEEE上发表的引用它的论文就有7篇之多.Intel已将该工具的源代码提交给Apache,社区反映相当热烈. IEEE论文链接 http://ie

Hadoop参考设计的实现及性能:英业达和技嘉的实现

英业达的561.html">参考设计实现 Name Node/Second Name Node 规格: DataNode/http://www.aliyun.com/zixun/aggregation/17034.html">TaskTracker 规格: 机柜规格: 技嘉的参考设计实现 Name Node/Second Name Node 规格(共两台服务器): DataNode/TaskTracker 规格: 机柜规格: 交换机:

Hadoop参考设计的实现及性能:HBase应用性能测试方法

测试工具 YCSB 的安装 YCSB介绍:YCSB(Yahoo! Cloud Serving Benchmark)是Yahoo开源的一款通用的性能测试工具.可以用于测试多种 NoSQL 产品进行测试.相关说明可以参考 https://github.com/brianfrankcooper/YCSB/wiki. YCSB的工作原理如上图所示,主要的模块包括workload和DB Interface: Workload:通过配置文件,定义读写比例,数据的大小等DB Interface:通过接口连接并

Hadoop参考设计的实现及性能:Intel平台产品参考

全球范围内的IT机构正在通过数据中心虚拟化来降低成本,进而获得更高的业务价值,同时借助自动化能力来提高服务级别.效率和灵活性.基于英特尔® 至强® 处理器的服务器为实现此创新奠定了基础.这些服务器在当前虚拟化中心和云环境中的所有服务器中占绝大部分的比例,而且能够为大多数具备最高性能的工作站提供支持. 最新的英特尔® 至强® 处理器 E5-1600/2600 产品家族将这些优势提升至新的高度,其性能比上一代产品提升多至80%,而且具备更出色的能源效率.最重要的是,这些处理器还提供了许多高级技术,以

Hadoop参考设计的实现及性能:第三方产品介绍

英业达服务器产品 K800(Romley-EP)是一款基于Romley-EP平台的标准2U服务器,高http://www.aliyun.com/zixun/aggregation/17968.html">内存容量,高网络速度,多样化的SATA扩展配置,支持板载的双千兆+双万兆可选配置,满足客户多样化的需求. 最高可支持16个内存条,容量高达512GB,轻松满足客户高内存容量的需求 主板多样化选择,可支持板载单万兆,板载双万兆,板载双千兆,板载双千兆+双万兆等多款差异化配置,可满足客户的各种

Hadoop一体机参考设计的方案设计原则

Hadoop是一种高度可伸缩的大数据应用方案,能过通过少至几台多至数千台互联的服务器处理几十TB到数百PB的数据.本参考设计实现了单一机柜的Hadoop集群设计,若用户需要多于一个机柜的Hadoop集群,可以通过扩张本设计中的服务器数量及网络带宽轻松实现扩张. Hadoop方案 Hadoop一体机设计 Hadoop方案的特点 Hadoop是一个低成本和高可扩展性的大数据处理平台.Hadoop提供了一个稳定的共享存储和分析系统,存储由HDFS(分布式数据存储)来实现,数据处理由MapReduce(

Hadoop参考设计组组件及关键步骤(一)

关于Hadoop参考设计组组件及关键步骤的文章内容比较多,所以小编将Hadoop参考设计组组件及关键步骤分成三节内容向大家进行详细的介绍. 软件 操作系统:Hadoop支持任何可以运行Java环境的操作系统.在实际应用中,一般客户多会选择不同Linux发布版的64位版本.在本参考设计中我们选择了免费的企业级Linux CentOS6.3 x64版. Hadoop系统:Hadoop是基于Apache授权协议的开源软件,客户能够在免费的开源版本及商业支持版之间选择.免费的开源版本目前尚存在大量软件B

hadoop教程(十一) 性能分析实验初步

[试验目的] 本试验目的是为了总结hadoop相关参数优化对性能的影响. [试验环境] 硬件环境 本次试验用机4台,配置一致: CPU:Intel(R) Xeon(R) CPU  E5620  @ 2.40GHz* 16 内存:MemTotal:       32867608 kB64bit linux版本CentOS release 6.2 (Final) 内核版本2.6.32-220.el6.x86_64 硬盘Model: IBM ServeRAID M5015 (scsi) Disk /d

关于mysql和hadoop数据交互的问题,和hadoop的文件夹设计

问题描述 关于mysql和hadoop数据交互的问题,和hadoop的文件夹设计 关于mysql和hadoop数据交互的问题,和hadoop的文件夹设计 关于mysql和hadoop数据交互的问题,和hadoop的文件夹设计 目前mysql按地区,商业区区分,假设读取mysql数据库的地区,根据地区划分 我昨天和领导沟通了,领导说点击率不是必要条件,地区划分才是重点,后面就是各方面劝导,只好以地区区分,关键是这个镇区区分数据和产品的话,全国有6k多个地区, 这样的hdfs文件夹数量,岂不是很崩溃