大数据学习路线copy自淘宝

来源:互联网 发布:南开大学网络教育报名 编辑:程序博客网 时间:2024/04/30 05:58

一、hadoop视频学习(入门到精通)

二、数据挖掘(入门到精通)

 

三、Hadoop学习路线

1.开发前期准备

首先,如果你没有Java和Linux基础,建议你先简单学一下这两门课程,此宝贝里面都为你准备好了。

 

2.云计算前期了解

当你初步掌握了Java和Linux基础后,你就可以进入大数据的学习了,我们可以先对云计算有一个前期的了解,在前期了解云计算这个文件夹中,包含了6套云计算相关的视频,你不用全部听完,建议听前两个。

4.storm学习 

本宝贝为大家准备3套Storm的学习视频,第一套是传智的Storm资料,课程是13年12月份,后两套是51上的课程,一套是视频教程(2013年11月),一套是项目视频(2014年5月),建议你有时间的话三套都进行学习。

6.Flume学习

Flume是Cloudera提供的一个高可用,高可靠的,分布式的海量日志采集,聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

本宝贝提供一套2013年10月的51 cto的flume学习课程,有这方面需要的可以进行学习。

四、数据挖掘资料  

包括:

课程目标:
熟悉课程里所介绍的各种算法的细节
懂得如何使用这些算法去解决实际场景问题
熟悉了解常用的机器学习和数据挖掘软件

育成目标:

数据分析师,算法设计师,具备算法设计能力的高层次程序员

4.《快速数据挖掘平台RapidMiner》课程

第一周:数据挖掘基本知识RapidMiner工具介绍

第二周:数据准备:导入、预处理、导出

第三周:数据挖掘模型和方法

第四周:K-Means 聚类与辨别分析

第五周:线性回归与逻辑回归

第六周:决策树与神经网络

第七周:文本挖掘

第八周:WEB挖掘

第九周:协同过滤、推荐

第十周:时间序列分析

第十一周:离群点分析

第十二周:模型评估-交叉验证与模型优化化

第十三周:过程控制

第十四周:数据转换与执行命令

5.推荐系统课程

第1课 推荐系统概述

第2课 最流行的推荐系统:itemCF和userCF

第3课 大数据环境下的itemCF实现

第4课 基于频繁模式的推荐系统,套餐设计

第5课 文本挖掘与标签系统

第6课 基于内容的推荐系统

第7课 社交网络好友推荐,图算法,在图数据库Neo4j上的实现

第8课 用Cypher语言实现好友推荐

第9课 实时推荐系统

6.《大数据的统计学基础》课程

第1周 面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表)

第2周 赌博设计:概率的基本概念,古典概型

第3周 每人脑袋里有个贝叶斯:条件概率与贝叶斯公式,独立性

第4周 啊!微积分:随机变量及其分布(二项分布,均匀分布,正态分布)

第5周 万事皆由分布掌握:多维随机变量及其分布

第6周 砖家的统计学:随机变量的期望,方差与协方差

第7周 上帝之手,统计学的哲学基础:大数定律、中心极限定理与抽样分布

第8周 点数成金,从抽样推测规律之一:点估计与区间估计

第9周 点数成金,从抽样推测规律之二:参数估计

第10周 对或错?告别拍脑袋决策:基于正态总体的设检验

第11周 扔掉正态分布:秩和检验

第12周 预测未来的技术:回归分析

第13周 抓住表象背后那只手:方差分析

第14周 沿着时间轴前进,预测电子商务业绩:时间序列分析简介

第15周 PageRank的背后:随机过程与马尔科夫链简介

授课对象:
这是一门数学课程,适合有志于转往大数据分析领域的非数学专业人士(例如IT人,业务人员等)补强数学基础,以更好地学习更高级的数据分析,数据挖掘,机器学习课程

==============================================================

《大数据的矩阵计算基础》课程内容:
课程简介:
炼数成金开设数据分析课程有一段时间了。在诸多课程里,常见到有学员根本不知道矩阵是何物,可能从来没学过,也可能学过忘光了,但作为数据分析里最常见的 数据结构类型,不理解矩阵,就看不懂公式,看不懂公式,就根本不懂数据分析的语言,学习起来犹如哑巴吃黄连有苦难言(《黑客帝国》里把那部控制一切的机器 称为Matrix——“矩阵”,这肯定不是无缘无故的)。至于像听Page-Rank,因子分析和主成分分析,推荐系统同现矩阵这些内容那就更像听天书。 由此我们萌发了开一门矩阵计算的基础课程,给大家补一下数学的念头!


课程内容:

<img src="https://img.alicdn.com/imgextra/i2/245281966/TB254c9dVXXXXbwXXXXXXXXXXXX-245281966.jpg" "="" align="absmiddle" width="738" height="511" style="border: 0px; vertical-align: top; margin: 0px; padding: 0px;">

 

0 0
原创粉丝点击