[Strata Data Conference培训课程] Apache Spark高级实践和原理解析

来源：互联网发布：备案域名不能打开编辑：程序博客网时间：2024/05/17 01:28

这几年随着大数据分析和机器学习等等在工业界中越来越广泛的应用，越来越多的人选择在大数据平台比如Apache Spark之上构建大规模数据处理、分析和机器学习，以便利用大量原始数据和扩展架构。如何深入理解大数据关键技术并更好的运用它们？本次课程将结合当前大数据技术的浪潮和趋势，为您介绍Apache Spark的高级实践和原理解析，帮助您加深领会Apache Spark的精华设计思想，以及如何与流式分析、机器学习，深度学习等紧密结合，在数据采集，分析处理，特征提取，机器学习等方面提供一致性和集成性的高级实践。

您将学到什么及如何应用之

Spark高级原理及如何在Spark上进行机器学习，以及如何使用英特尔最新开源的分布式深度学习库在Spark上进行深度学习

本培训适合您因为…

Spark高级设计原理及如何在Spark上进行机器学习深度学习

预备条件：

软件开发人员及大数据工程师，以及高级数据分析人员。学员需掌握使用Linux环境的基本技能，最好具备Spark以及机器学方面的基本知识或经验：并能熟练使用至少一种脚本编程语言，建议Scala，Python，或者熟悉其他语言譬如Perl或Ruby。

具体课程内容涉及到

Apache Spark 揭秘

Spark 设计揭秘
Spark shuffle
Spark memory management

Spark SQL 揭秘

什么是Spark SQL
Spark SQL 特性
Spark SQL 工作原理

Spark Streaming

流数据
Spark Streaming 设计原理
如何实现高可用性

Machine learning on Spark

Scaling out ML algorithms on Spark
End-to-end machine-learning pipelines

Deep learning on Spark using BigDL

BigDL概述
在Spark上如何使用BigDL

本次课程是针对Spark中高级用户的，对SPARK深度的原理解析和高级实践分享，希望您具备一定的Spark 知识技能，并对流式分析及机器学习有一定的兴趣或了解。最后希望此课程能帮助您加速Spark分析以及机器学习的实践，为您的数据科学学习和工作开启一页新篇章。

关于导师

Carson Wang

Carson Wang is a big data software engineer at Intel, focusing on developing and improving new big data technologies. He is an active open source contributor to the Spark and Alluxio projects. Prior to Intel, Carson was an engineer at Microsoft working on cloud computing technologies.

俞育才

英特尔大数据架构师，Spark开源贡献者。10年软件开发经验，熟悉大数据，流计算，存储，虚拟化。曾帮助多家公司构建基于Spark的流处理方案。

Zhichao Li

利智超来自于Intel大数据技术团队，专注于大数据分析领域, Spark contributor。他的同事和他致力于在Apache Spark平台上开发分布式机器学习算法，以满足大数据背景下的机器学习需求。他还为这些分布式机器学习算法在Intel平台上进行优化，以及帮助Intel的客户为他们的业务开发大数据分析程序。

Yiheng Wang

Yiheng Wang is a software development engineer on the Big Data Technology team at Intel who works in the area of big data analytics. He and his colleagues are developing and optimizing distributed machine-learning algorithms (e.g., neural network and logistic regression) on Apache Spark. He also helps Intel customers build and optimize their big data analytics applications.

Daoyuan Wang

王道远，英特尔亚太研发有限公司资深软件工程师，自2014年起参与Spark SQL开发，是Apache Spark开源社区的活跃贡献者。在参与Spark开发之前，他参与了IDH版本Hive的开发。译有《Spark快速大数据分析》一书。

Strata Data Conference北京站正在报名中，点击图片中二维码可登录会议网站，浏览截止到目前为止的讲师名单和已经确认的议题，早期票价优惠期截止到6月9日，尽快注册以确保留位。

阅读全文

0 0