Hadoop入门之Sqoop的安装和数据导入导出
来源:互联网 发布:三国群英传ol 知乎 编辑:程序博客网 时间:2024/05/17 15:19
1、下载并解压
最新版下载地址http://ftp.wayne.edu/apache/sqoop/1.4.6/
2、修改配置文件
$ cd $SQOOP_HOME/conf
$ mv sqoop-env-template.sh sqoop-env.sh
打开sqoop-env.sh并编辑下面几行:
export HADOOP_COMMON_HOME=/home/hadoop/app/hadoop-2.6.1/
export HADOOP_MAPRED_HOME=/home/hadoop/app/hadoop-2.6.1/
export HIVE_HOME=/home/hadoop/app/hive
3、加入mysql的jdbc驱动包
cp ~/app/hive/lib/mysql-connector-java-5.1.28.jar $SQOOP_HOME/lib/
验证启动
$ cd $SQOOP_HOME/bin
$ sqoop-version
预期的输出:
15/12/17 14:52:32 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6
Sqoop 1.4.6 git commit id 5b34accaca7de251fc91161733f906af2eddbe83
Compiled by abe on Fri Aug 1 11:19:26 PDT 2015
到这里,整个Sqoop安装工作完成。“导入工具”导入单个表从RDBMS到HDFS。表中的每一行被视为HDFS的记录。所有记录都存储为文本文件的文本数据(或者Avro、sequence文件等二进制数据)
语法
下面的语法用于将数据导入HDFS。
示例
表数据
这里直接用上次搭建的azkaban任务产出的数据表吧:
导入表表数据到HDFS
下面的命令用于从MySQL数据库服务器中的emp表导入HDFS。
$bin/sqoop import \
--connect jdbc:mysql://localhost:3306/azkaban \
--username root \
--password gome_search \
--table project_flows \
--m 1验证在HDFS导入的数据是否成功
导入到HDFS指定目录
在导入表数据到HDFS使用Sqoop导入工具,我们可以指定目标目录。
以下是指定目标目录选项的Sqoop导入命令的语法。
下面的命令是用来导入project_permissions 表数据到'/queryresult'目录。
导入表数据子集
我们可以导入表的使用Sqoop导入工具,"where"子句的一个子集。它执行在各自的数据库服务器相应的SQL查询,并将结果存储在HDFS的目标目录。
where子句的语法如下。
Sqoop的数据导出
将数据从HDFS导出到RDBMS数据库
导出前,目标表必须存在于目标数据库中。
- 默认操作是从将文件中的数据使用INSERT语句插入到表中
- 更新模式下,是生成UPDATE语句更新表数据
语法
以下是export命令语法示例
数据是在HDFS 中“/azkaban_demo/”目录的emp_data文件中。所述emp_data如下:1201, gopal,manager, 50000, TP
1202, manisha,preader, 50000, TP
1203, kalil,php dev, 30000, AC
1204, prasanth,php dev, 30000, AC
1205, kranthi,admin,20000, TP
1206, satish p, grp des, 20000, GR1、首先需要手动创建mysql中的目标表
CREATE TABLE employee (
id INT NOT NULL PRIMARY KEY,
name VARCHAR(20),
deg VARCHAR(20),
salary INT,
dept VARCHAR(10));2、然后执行导出命令
select * from employee;
- Hadoop入门之Sqoop的安装和数据导入导出
- mysql数据导入Hadoop之Sqoop安装
- 大数据基础(二)hadoop, mave, hbase, hive, sqoop在ubuntu 14.04.04下的安装和sqoop与hdfs,hive,mysql导入导出
- hadoop平台下的数据导入导出工具Sqoop
- sqoop的数据导入导出
- Sqoop的安装与数据的导入导出
- Sqoop安装配置及数据导入导出
- sqoop安装与导入导出数据
- sqoop数据导入导出
- Sqoop数据导入导出
- Sqoop数据迁移,工作机制,sqoop安装(配置),Sqoop的数据导入,导入表数据到HDFS,导入关系表到HIVE,导入到HDFS指定目录,导入表数据子集,按需导入,增量导入,sqoop数据导出
- Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具
- sqoop数据导出导入命令
- sqoop数据导出导入命令
- Sqoop 数据导入导出实践
- Sqoop进行数据导入导出
- 使用sqoop导入导出数据
- Hive数据导入、sqoop数据导入导出
- Cheapest Palindrome(最便宜的回文)
- linux 安装jdk和安装Tomcat 和rsync和crontab搭配的备份。
- TortoiseSVN的bin目录下面没有svn.exe
- win10 npm安装node-sass文件出错
- Javascript本地存储数据方案
- Hadoop入门之Sqoop的安装和数据导入导出
- JAVA中Properties的使用
- 20170922文本属性
- Java实现几种常见排序方法
- JQuery
- java设计模式-代理模式
- SLIC超像素分割算法
- Spring Security 3用户登录实现之十 用户切换
- Mysql数据库设计规范之二数据库字段设计规范