初学HADOOP(MAPREDUCE-WORLD COUNT/HIVE/SQOOP)
来源:互联网 发布:互联网金融平台源码 编辑:程序博客网 时间:2024/06/13 19:28
MAPREDUCE-WORLD COUNT
mapreduce-并行处理大数据集的框架 处理机制:JOBTRACKER-TASKTRACKER-JOB-MAP-REDUCE-OUTPUT主要思想:分而制之
#查看JAR信息hadoop jar hadoop-mapreduce-examples-2.7.1.jar#在HDFS新建目录 此目录虚拟?hadoop fs -mkdir /input#将服务器的文件拷贝到HDFS目录下hadoop fs -put input/test.txt /input#执行WORLDCOUNT /output表示使用 HDFS 根目录下的 output 目录存储程序的输出,文件会自动生成hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount /input /output#查看生成内容hadoop fs -cat /output/*
HIVE SQOOP MYSQL 数据同步
HIVE---数据仓库 实时性能差 主要提供对hadoop数据进行SQL查询的接口
SQOOP---用来将Hadoop和关系型数据库中的数据相互转移的开源工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
配置HIVEhttp://blog.csdn.net/sl1992/article/details/53589349
HIVE常用语法http://blog.csdn.net/wisgood/article/details/17186599
配置SQOOPhttp://blog.csdn.net/scgh_fx/article/details/73522372
利用SQOOP导入mysql数据
sqoop list-databases -connect jdbc:mysql://localhost:3306 -username root -password root
sqoop import -m 1 --connect jdbc:mysql://locahost:3306/hive --username root --password root --table table_name --hive-import --hive-database database_name --hive-overwrite --create-hive-table --hive-table hive-table_name --delete-target-dir
阅读全文
0 0
- 初学HADOOP(MAPREDUCE-WORLD COUNT/HIVE/SQOOP)
- Hadoop+hive+sqoop环境部署
- 初探hadoop+hbase+sqoop+hive
- 初学Hadoop之MapReduce
- 【hadoop Sqoop】Sqoop从mysql导数据到hive
- CDH版 Hadoop Hive Sqoop 安装
- Hive分区表count(*)不起mapreduce的真相
- 获取原生mapreduce程序、sqoop、hive提交的jobId
- 论坛日志分析:Flume+MapReduce+Hive+Sqoop+MySQL
- hadoop生态系统搭建(hadoop hive hbase zookeeper oozie sqoop)
- 急性子的开源大数据,第 1 部分: Hadoop 教程:Hello World 与 Java、Pig、Hive、Flume、Fuse、Oozie,以及 Sqoop 与 Informix、DB2 和
- 急性子的开源大数据,第 1 部分: Hadoop 教程:Hello World 与 Java、Pig、Hive、Flume、Fuse、Oozie,以及 Sqoop 与 Informix、DB2 和
- hadoop mapreduce hello world(wordcount)
- hadoop初学之MapReduce编程模型学习
- Hadoop,hbase,hive,zookeeper,mapreduce,hdfs
- MapReduce\Hadoop\HDFS上\Hive学习笔记
- Hadoop入门(三):Sqoop和Hive的使用
- hadoop日志【1】--hive服务和sqoop服务运行
- Test AM572x CortexA15 CortexM4
- JAVA虚拟机体系结构
- mui 原生等待框显示showWaiting
- HDU
- 数组迭代要优先使用for循环而不是for...in循环
- 初学HADOOP(MAPREDUCE-WORLD COUNT/HIVE/SQOOP)
- Day20
- (转)POJ3101 Astronomy【素因子分解】【大数乘法】
- 数组二分查找
- React Native之FlexBox布局上的一些心得
- SQL 优化
- HDU1233 还是畅通工程
- Connection接口及DriverManager类
- Linux进程间通讯一--无名管道PIPE