E-MapReduce中引导操作安装使用Kylin

        目前E-MapReduce的开源组件还未包含Kylin,下面介绍一种通过创建集群时设置的引导操作来完成集群上Kylin的部署。

1.引导操作shell脚本(kylin_bootstrap.sh)

入参:

参数名 取值 备注
regionId cn-hangzhou/cn-beijing 创建集群所在的regionId
isVpc 0/1 创建的是否是vpc集群
#!/bin/bash
regionId="$1"
isVpc=$2

echo $regionId
echo $isVpc
if [ ! $regionId ]; then
    regionId="cn-hangzhou"
fi

if [ ! $isVpc ]; then
    isVpc=0
fi

isMaster=`hostname --fqdn | grep emr-header-1`
masterIp=`cat /etc/hosts | grep emr-header-1 | awk '{print $1}'`

bucket=""
if [[ $regionId == "cn-hangzhou" ]]; then
    bucket="emr-agent-pack"
elif [[ $regionId == "cn-beijing" ]]; then
    bucket="emr-bj"
elif [[ $regionId == "cn-shanghai" ]]; then
    bucket="emr-public-shanghai"
elif [[ $regionId == "cn-shenzhen" ]]; then
    bucket="emr-public-shenzhen"
fi

kylinpackUrl="http://emr-agent-pack.oss-cn-hangzhou-int    ernal.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
if [[ isVpc -eq 1 ]]; then
    kylinpackUrl="http://$bucket.vpc100-oss-$regionId.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
else
    kylinpackUrl="http://$bucket.oss-$regionId-internal.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
fi

cd /opt/apps
wget $kylinpackUrl
tar xvf apache-kylin-1.6.0-hbase1.x-bin.tar.gz
rm -rf /opt/apps/apache-kylin-1.6.0-hbase1.x-bin.tar.gz
chown -R hadoop:hadoop /opt/apps/apache-kylin-1.6.0-hbase1.x-bin

ln -s /opt/apps/apache-kylin-1.6.0-hbase1.x-bin /usr/lib/kylin-current
echo "export KYLIN_HOME=/usr/lib/kylin-current" >>/etc/profile.d/hadoop.sh
echo "export HIVE_CONF=/etc/emr/hive-conf" >>/etc/profile.d/hadoop.sh

echo "
if [ $isMaster ]; then
    sleep 5
    su -l hadoop -c '/opt/apps/apache-kylin-1.6.0-hbase1.x-bin/bin/kylin.sh start'
else
    echo 'slave no need to start kylin'
fi
" >/usr/local/emr/emr-bin/script/hive/after_start.sh

2.OSS存储kylin_bootstrap.sh

将1中的kylin_bootstrap.sh脚本上传到OSS中,创建集群的时候需要从OSS中选择

3.创建E-MapReduce集群(添加引导操作)

在E-MapReduce中创建集群(必须勾选HBase),在创建集群的基础配置页面,点击添加引导操作,选择2中OSS的kylin_bootstrap.sh脚本,并且根据需求填写可选参数(即1中介绍的脚本入参),如下图所示(在深圳region创建classic集群)

)

4.验证

集群创建完成,状态显示为空闲后,打隧道到master节点,在浏览器中输http://localhost:7070/kylin , 查看Kylin是否正常。

备注
上述创建的Kylin是非HA,只有master上面一台Kylin的webserver。
如果需要多台,则可以在slave上面启动,需要做如下操作:
1). 修改kylin.properties 详见Kylin文档

kylin.rest.servers=emr-header-1:7070,emr-worker-1:7070,emr-worker-2:7070 //比如启动了三台
kylin.server.mode=all //只要有一台配置成all,其它配置成query

2). 在slave节点启动Kylin,并重启master节点的Kylin

sudo su hadoop
/usr/lib/kylin-current/bin/kylin.sh start

3). 配置SLB负载均衡

 通过阿里云的SLB负载均衡,将上述启动的所有Kylin的webserver进行负载均衡的配置,[详见SLB](https://help.aliyun.com/document_detail/27551.html?spm=5176.doc27552.6.561.90KCkd)
时间: 2024-11-08 17:27:58

E-MapReduce中引导操作安装使用Kylin的相关文章

如何在E-MapReduce上使用引导操作安装kafka组件

1. 什么是引导操作 关于E-MapReduce上引导操作的概念和使用方式请参考文档. 2. 编写安装Kafka组件的脚本 在E-MapReduce中编写安装Kafka组件脚本主要有以下几步: 下载Kafka-0.10.0.0安装包 修改Kafka配置文件 创建Kafka Log目录 启动Kafka daemon进程 以下是安装Kafka组件的脚本简单示例: #!/bin/bash isMaster=`hostname --fqdn | grep emr-header` if [ -n "$is

用引导操作给E-MapReduce集群安装impala

当前emr最新版本2.0.1没有impala组件,需要额外安装.本文介绍如何在emr 2.0.1版本上用E-MapReduce软件配置功能修改hdfs配置,引导操作安装impala 2.5.0 for cdf 5.7.1版本,shell作业来启动impala的完整过程. 软件配置 impala对hdfs组件的配置有要求,需要用软件配置功能修改hdfs的配置.软件配置功能可以修改hadoop组件的配置,详见: 帮助文档 本地创建一个hdfs.json文件,可以直接从oss下载,内容如下,通过oss

MapReduce中连接负载均衡优化研究

MapReduce中连接负载均衡优化研究 翟红敏 刘国华 赵威 刘源源 翟红坤 数据分析和处理是大规模分布式数据处理应用中的重要任务.由于简单易用和具有灵活性,MapReduce编程模型逐渐成为大规模分布式数据处理系统(如Hadoop系统)的核心模型.由于所处理的数据可能不是均匀分的,MapReduce编程模型在处理连接操作时,会出现数据倾斜问题.数据倾斜问题严重降低了MapReduce执行连接操作的效率.针对MapReduce中连接操作的数据倾斜问题,分析了造成MapReduce连接性能瓶颈的

用引导操作给E-MapReduce集群安装presto组件

当前emr最新版本1.3.0没有presto组件,需要额外安装.本文介绍如何用E-MapReduce引导操作来安装presto 0.147版本.引导操作可以在集群创建时执行指定的脚本,详见: 帮助文档 .我们要执行的引导操作是安装配置jdk8,安装配置presto 0.147,安装presto cli(可选). 准备脚本 上传安装jdk8的脚本 当前emr集群的jdk版本是1.7,由于presto 0.86以上版本最低jdk要求是jdk8,所以需要给集群安装jdk8.以后集群默认jdk版本升级到

hadoop map-reduce中的文件并发操作_数据库其它

这样的操作在map端或者reduce端均可.下面以一个实际业务场景中的例子来简要说明. 问题简要描述: 假如reduce输入的key是Text(String),value是BytesWritable(byte[]),不同key的种类为100万个,value的大小平均为30k左右,每个key大概对应 100个value,要求对每一个key建立两个文件,一个用来不断添加value中的二进制数据,一个用来记录各个value在文件中的位置索引.(大量的小文件会影响HDFS的性能,所以最好对这些小文件进行

XP下引导LINUX安装程序心得

  XP下引导LINUX安装程序详解   本来早就想写,但由于打游戏的时间实在是抽不出来,最近有时间了,把它写出来供大家分享. AAAAA需要的东东: 1.LINUX安装文件(ISO的),把这个ISO中的isolinux(文件夹)解压出来,放在同一个盘下面. 2.WINGRUB百度搜一下就可以下载 3.当然你的系统要是XP或是2003,2000也行(但没有实践过). 我们以XP为例,03操作一样. BBBBB具体操作和注释:     1.先在XP下空出来两个盘,一个用来存储LINUX安装文件(I

mongodb-MongoDB中的mapReduce中reduce文件只作用在一个文档上

问题描述 MongoDB中的mapReduce中reduce文件只作用在一个文档上 小白刚接触MongoDB,看到mapReduce这里不是很清楚,自己编了一段代码,想做个计数,然后发觉map方法出来的value如果只有一个元素的时候,好像不参与到reduce函数的计算中.如: var map=function(){ emit(this.name{count:1})}var reduce=function(keyvalues){ var count=0; for(var i in values)

win8中IE10无法安装Flash Player插件怎么办

在进行操作之前我们需要了解一点,从IE10开始,IE浏览器默认内置了微软专门定制的Flash Player插件,并且是以Windows系统更新补丁的形式存在的,如果你是从网上下载Flash Player独立安装包进行安装时会出现如下错误: 安装遇到错误: 您的Microsoft Internet Explorer浏览器包含最新版本的内置Adobe Flash Player.有新版本的Flash Player可用时,Windpws UPdate会通知你. 所以要重装Flash Player,我们是

mapreduce,java处理操作文件

问题描述 mapreduce,java处理操作文件 A文件 1 q*a*z 2 w*s*x B文件 1 q 1 a 1 z 2 w 2 s 2 x 利用java代码怎么把A文件转变成B文件 解决方案 找到转换规律之后,然后就是读取A文件, 逐行读取readLine(),先用split("空格")将这一行数据进行分割,正常情况能分割成两条记录,然后再对第二条记录进行分割split("星号") 然后写入文件B中.这个需求还是很简单的.如果你熟悉文件操作的话,大概的伪代码