互联网技术学习中的一些资源总结

来源:互联网 发布:干软件二次开发怎么样 编辑:程序博客网 时间:2024/06/06 02:58

互联网技术学习中的一些资源总结

Hadoop在大数据世界里的地位毋庸置疑,总结一下一些学习资源。当然还有一些java、python等等。

IT电子书下载:只有英文版哦

http://it-ebooks.info

Hadoop

准备工作

YARN介绍

Yarn from Hortonworks

Yarn from IBM developerworks

Hadoop 生态系统

Hadoop Ecosystem at a Glance

SQL on Hadoop

SQL is what’s next for Hadoop: Here’s who’s doing it

All SQL-on-Hadoop Solutions are missing the point of Hadoop

Hadoop Summit

Hadoop Summit, San Jose

书籍和Paper

Hadoop : The Definitive Guide 绝对是经典中的经典

Hadoop: The Definitive Guide, 4rd Edition

该书作者的Github主页及Hadoop-book主页

Tom white’s home - Github

tomwhite/hadoop-book · GitHub

Google的三辆马车,GFS, MapReduce, BigTable

Google的新三辆马车:Caffeine、Pregel、Dremel

Big Data beyond MapReduce: Google’s Big Data papers

入门

1、理解MapReduce框架的基本流程:Map、shuffle、Reduce

2、清楚Combiner, partition作用,设置Compression

3、能搭建Hadoop集群,Master/Slave 都运行那些服务 NameNode, DataNode, JobTracker, TaskTracker,最好是完全分布式的Hadoop集群

4、Pig, Hive 简单语法,UDF写法

When to use Pig Latin versus Hive SQL?

Introduction to Apache Hive Online Training

Hive – A Petabyte Scale Data Warehouse Using Hadoop

Hadoop 2.0新知识 (Hadoop 1.xx VS Hadoop 2.xx)

HDFS2 HA, Snapshot, ResourceManager,ApplicationsManager, NodeManager

进阶

HDFS,Replica如何定位

HDFS Design

Hadoop 参数调优,性能优化,Cluster level: JVM, Map/Reduce Slots, Job level: Reducer #, Memory, use Combiner? use Compression?

7 Tips for Improving MapReduce Performance

Apache HBase ™ Reference Guide

算法

字典同位词:由相同字母组成的不同单词

翻译SQL语句

MapReduce Algorithms

Designing algorithms for Map Reduce

Blog

董的博客

Tom white

caibinbupt

Hadoop中的集群配置和使用技巧

HORTONWORKS

让你知道日志文件在大数据中是多么重要

LinkedIn大数据后台是如何运作的 翻译版本

与Hadoop相关系统

数据流系统: Storm

内存计算系统: Spark and Shark

交互式实时系统:Cloudera Impala, Apache Drill (Dremel开源实现),Tez (Hortonworks)

大数据学习资源整理

Hadoop相关公司

Powered by

Java

查看知识点,当然不仅只有java。

Top 50个快速高效学习 Java 的在线资源

其它类

Coursera 上有哪些课程值得推荐?

一个架构仁波切的博客

2016年科技阅读列表

董老师在硅谷知乎专栏

刘未鹏博客

Linux

有这个教程后就不需要买什么歌叫你学Linux了,命令忘了上网查,多查几次你就主动去记住应该记住的命令。

Linux 使用,基本的 Shell 编程,这个视频教程很好,我一直用它学Linux

版本控制系统的使用 Git/SVN

面试

面试经验分享四篇

面试经验分享之机器学习、大数据问题

面试经验分享之智力题

面试经验分享之数据结构、算法题

面试经验分享之编程语言题

养成维护自己中英文简历的习惯(mordenCV)

在线代码测评,如 Leetcode

笔试、面试题库,如 牛客网

笔试面试经验,如 米群

题解及 Cheat Sheet,如 LeetCode 题解、Machine Learning Cheat Sheet

时间管理

知识管理

站点推荐

技术文章聚合:伯乐在线、码农周刊、推酷、酷壳、鲜果

问答:V2EX、SegmentFault、Reddit

视频:慕课网
Github 不仅是代码,还有技术笔记、题解等等

知识保存

用版本控制工具和代码片段工具管理你的代码

Markdown :

Ulysses、Haroopad 等 Markdown 类编辑软件

Gitbook 适合教程类书籍写作

《Docker 技术入门与实践》 杨保华

Pocket 花瓣网

《程序员编程艺术:面试和算法心得》

该资源由本人整理,很大部分来自于 董飞老师的知乎

0 0
原创粉丝点击