hadoop生态系统学习笔记

来源:互联网 发布:昆士兰大学软件专业 编辑:程序博客网 时间:2024/06/05 23:43

hadoop生态系统学习笔记

本系列主要介绍hadoop生态系统学习路线,此文仅作为学习笔记。

  • 实验环境
  • 本人使用两台win7 x64 为便于区分就称作pcA 和 pcB, 将pcA作为hadoop集群服务器使用(在此电脑中配置4台虚拟机),将pcB连接集群进行操作。
  • 虚拟机:VMware Workstation 10.0.1
  • 虚拟机中Linux系统为:ubuntu-14.04-desktop-amd64.iso
  • hadoop版本:hadoop-2.7.4.tar.gz
  • zookeeper版本:zookeeper-3.4.10.tar.gz
  • hive版本:hive-2.3.2.tar.gz
  • hbase版本:hbase-1.2.6.tar.gz
  • (均可在Apache官网下载,后续笔记中也会给出我的百度云盘下载地址)

  • 章节设置

  • 1、生态系统版本匹配
  • 2、hadoop完全分布式安装配置
  • 3、yarn集群配置
  • 4、zookeep安装配置
  • 5、hive安装配置
  • 6、hbase安装配置
  • 7、eclipse连接hadoop集群配置
  • 8、Java编写wordcount代码(Eclipse)
  • 9、hive整合hbase,向hbase导入CSV文件数据
  • 10、待续