Spark基础:使用维基百科数据集来用Spark进行原型实验
来源:互联网 发布:cdn 端口 编辑:程序博客网 时间:2024/05/16 15:28
Apache Spark的真正价值和强大能力在于用它可以构建一个统一一致的分析场景,囊括了从ETL(数据抽取、转换和载入)、批处理分析、实时流分析、机器学习、图类型数据分析,到可视化的多种功能。在这个历时2天的课程里,布莱恩·克莱坡通过对多种维基百科数据集的动手操作来展示了理想中Spark可以完成的多样化的编程模式。在培训结束时,参加者将具备运用Spark来进行概念验证和原型搭建的能力。
本课程包括50%的讲座和50%的动手编程实践。所有的参与者在课程结束后还可以获得Databricks内容一个月的接入,方便参与者继续进行课堂实践和完成作业。
阅读原文 ( read more ) 浏览更多培训信息
阅读全文
0 0
- Spark基础:使用维基百科数据集来用Spark进行原型实验
- spark 官方动手练习二:用spark浏览维基百科的数据
- spark 官方动手练习二:用spark浏览维基百科的数据<转>
- 使用中文维基百科进行Word2Vec实验
- 使用中文维基百科进行GloVe实验
- Spark是什么?用Spark进行数据分析
- Spark 实战,第 3 部分: 使用 Spark SQL 对结构化数据进行统计分析
- Spark 实战,第 3 部分: 使用 Spark SQL 对结构化数据进行统计分析
- spark机器学习(Chapter 03)--使用spark-python进行数据预处理和特征提取
- 『 Spark 』7. 使用 Spark DataFrame 进行大数据分析
- 『 Spark 』7. 使用 Spark DataFrame 进行大数据分析
- Spark 与 大数据基础
- 使用spark读取es中的数据并进行数据清洗,使用fp-growth算法进行加工
- spark sql基础使用范例
- Spark安装与基础使用
- 使用spark检查数据质量
- Spark RDD进行艺术家数据集清洗
- Spark基础
- 蚂蚁金服首席技术官--程立
- Strata + Hadoop World北京大会早期门票价格将于24小时后结束
- Strata + Hadoop World 2天培训课程
- Apache Cassandra:多学多得
- 在Spark和Hadoop上做大规模数据科学
- Spark基础:使用维基百科数据集来用Spark进行原型实验
- Strata + Hadoop World 北京大会早期门票价格将在7月8日周五截止
- 使用 replace 更新某表中某个字段详细内容
- 欧洲核子研究组织如何预测新的流行数据集
- Strata+Hadoop World 北京大会日程发布
- 记录一次celery+rabbitmq的bug修复过程
- Strata+Hadoop World 北京首届会议
- 日志和实时流计算处理
- 机器智能的未来