Hadoop学习计划

来源:互联网 发布:js 随机数 生成原理 编辑:程序博客网 时间:2024/06/16 23:31
链接:https://www.zhihu.com/question/19795366/answer/24524910

推荐一些Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

一、学习路线图
  • Hadoop家族学习路线图 开篇必读
  • Hive学习路线图
  • Mahout学习路线图
二、编程实践
  • Hadoop历史版本安装
  • 用Maven构建Hadoop项目
  • Hadoop编程调用HDFS
  • 用Maven构建Mahout项目
  • Mahout推荐算法API详解
  • 用MapReduce实现矩阵乘法
  • 从源代码剖析Mahout推荐引擎
  • Mahout分步式程序开发 基于物品的协同过滤ItemCF
  • Mahout分步式程序开发 聚类Kmeans
  • PageRank算法并行实现
三、案例分析
  • 海量Web日志分析 用Hadoop提取KPI统计指标
  • 用Hadoop构建电影推荐系统
  • 用Mahout构建职位推荐引擎
  • Mahout构建图书推荐系统
  • PeopleRank从社交网络中发现个体价值