Sqoop 安装

简介

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

环境说明

Centos 7服务器
服务当前用户 hadoop(此用户有管理员权限)
Sqoop当前版本1.99.7
风.fox

下载地址

http://archive.apache.org/dist/sqoop/

wget http://archive.apache.org/dist/sqoop/1.99.7/sqoop-1.99.7-bin-hadoop200.tar.gz

tar -zxvf sqoop-1.99.7-bin-hadoop200.tar.gz

安装

mv sqoop-1.99.7-bin-hadoop200 ~/sqoop

环境变量设置

vim ~/.bashrc

增加

export SQOOP_HOME=/home/hadoop/sqoop
export PATH=$SQOOP_HOME/bin:$PATH
export CATALINA_BASE=$SQOOP_HOME/server
export LOGDIR=$SQOOP_HOME/logs/

应用环境变量

. ~/.bashrc

Sqoop与Hadoop整合配置

修改Sqoop 配置文件中的 Hadoop 配置文件路径

vim /home/hadoop/sqoop/conf/sqoop.properties

修改为

org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/usr/local/hadoop/etc/hadoop/

启动

/home/hadoop/sqoop/bin/sqoop.sh server start

关闭

/home/hadoop/sqoop/bin/sqoop.sh server stop

客户端

/home/hadoop/sqoop/bin/sqoop.sh client

更多请看
http://houshangxiao.iteye.com/blog/2070057

时间: 2024-10-31 22:21:44

Sqoop 安装的相关文章

如何将mysql数据导入Hadoop之Sqoop安装

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中.Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目. 总之Sqo

Sqoop安装使用

1 环境 1.操作系统:CentOS-6.5-x86 2.JDK-1.6.0_45 3.Hadoop-1.2.1 4.Zookeeper-3.4.6 5.sqoop-1.4.5.bin__hadoop-1.0.0 2 搭建前提条件 已经按照Hadoop中"HBase安装"文章,已经搭建起了一个Hbase数据库,并且已经启动. 3 部署步骤 3.1 下载 http://sqoop.apache.org/ 3.2 安装 安装目录:/opt 修改操作权限: sudo chmod 755 sq

SQOOP安装部署

1.环境准备 1.1软件版本 sqoop-1.4.5 下载地址 2.配置 sqoop的配置比较简单,下面给出需要配置的文件 2.1环境变量 sudo vi /etc/profile SQOOP_HOME=/home/hadoop/source/sqoop-1.4.5 PATH=$SQOOP_HOME/bin export SQOOP_HOME 2.2sqoop-env.sh #Set path to where bin/hadoop is available export HADOOP_COMM

使用Sqoop job工具同步数据

我们使用的是Sqoop-1.4.4,在进行关系型数据库与Hadoop/Hive数据同步的时候,如果使用--incremental选项,如使用append模式,我们需要记录一个--last-value的值,如果每次执行同步脚本的时候,都需要从日志中解析出来这个--last-value的值,然后重新设置脚本参数,才能正确同步,保证从关系型数据库同步到Hadoop/Hive的数据不发生重复的问题. 而且,我们我们需要管理我们使用的这些脚本,每次执行之前可能要获取指定参数值,或者修改参数.Sqoop也提

Sqoop 数据导入导出实践

Sqoop是一个用来将hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:mysql,oracle,等)中的数据导入到hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中. 1.简介 首先切换到到hadoop用户:su - hadoop 温馨提示:oracle的所有表名列名都要大写!!! 下面的代码,在命令行输入的时候,可能要写成一行 比如第一条需要写成: sqoop export --table Oracle_table_name --connect

《Hadoop实战手册》一1.4 使用Sqoop从MySQL数据库导入数据到HDFS

1.4 使用Sqoop从MySQL数据库导入数据到HDFS Sqoop是Apache基金下的一个项目,是庞大Hadoop生态圈中的一部分.在很多方面Sqoop和distcp很相似(见1.3节).这两个工具都是构建在MapReduce之上的,利用了MapReduce的并行性和容错性.与集群间的数据复制不同,Sqoop设计通过JDBC驱动连接实现Hadoop集群与关系数据库之间的数据复制. 它的功能非常广泛,本节将以网络日志条目为例展示如何使用Sqoop从MySQL数据库导入数据到HDFS. 准备工

《Hadoop实战手册》一1.5 使用Sqoop从HDFS导出数据到MySQL

1.5 使用Sqoop从HDFS导出数据到MySQL Sqoop是Apache基金会下的一个项目,是庞大Hadoop生态圈中的一部分.在很多方面Sqoop和distcp很相似(见1.3节).这两个工具都是构建在MapReduce之上的,利用了MapReduce的并行性和容错性.与集群间的数据复制不同,Sqoop设计通过JDBC驱动连接实现Hadoop集群与关系数据库之间的数据复制. 它的功能非常广泛,本节将以网络日志条目为例展示如何使用Sqoop从HDFS导入数据到MySQL数据库. 准备工作

Hadoop数据传输工具sqoop

概述 sqoop是Apache顶级项目,主要用来在Hadoop和关系数据库中传递数据.通过sqoop,我们可以方便的将数据从关系数据库导入到HDFS,或者将数据从HDFS导出到关系数据库.sqoop架构: sqoop架构非常简单,其整合了Hive.Hbase和Oozie,通过map-reduce任务来传输数据,从而提供并发特性和容错. sqoop的进一步发展可以参考:A New Generation of Data Transfer Tools for Hadoop: Sqoop 2 sqoop

mysql数据与Hadoop之间导入导出之Sqoop实例

前面介绍了sqoop1.4.6的 如何将mysql数据导入Hadoop之Sqoop安装,下面就介绍两者间的数据互通的简单使用命令. 显示mysql数据库的信息,一般sqoop安装测试用 sqoop list-databases --connect jdbc:mysql://192.168.2.101:3306/ --username root --password root 显示数据库里所有表: sqoop list-tables --connectjdbc:mysql://192.168.2.