[Strata Data Conference培训课程] Apache Spark高级实践和原理解析
来源:互联网 发布:备案域名不能打开 编辑:程序博客网 时间:2024/05/17 01:28
这几年随着大数据分析和机器学习等等在工业界中越来越广泛的应用,越来越多的人选择在大数据平台比如Apache Spark之上构建大规模数据处理、分析和机器学习,以便利用大量原始数据和扩展架构。如何深入理解大数据关键技术并更好的运用它们?本次课程将结合当前大数据技术的浪潮和趋势,为您介绍Apache Spark的高级实践和原理解析,帮助您加深领会Apache Spark的精华设计思想,以及如何与流式分析、机器学习,深度学习等紧密结合,在数据采集,分析处理,特征提取,机器学习等方面提供一致性和集成性的高级实践。
您将学到什么及如何应用之
Spark高级原理及如何在Spark上进行机器学习,以及如何使用英特尔最新开源的分布式深度学习库在Spark上进行深度学习
本培训适合您因为…
Spark高级设计原理及如何在Spark上进行机器学习深度学习
预备条件:
软件开发人员及大数据工程师, 以及高级数据分析人员。学员需掌握使用Linux环境的基本技能,最好具备Spark以及机器学方面的基本知识或经验:并能熟练使用至少一种脚本编程语言,建议Scala,Python,或者熟悉其他语言譬如Perl或Ruby。
具体课程内容涉及到
Apache Spark 揭秘
Spark 设计揭秘
Spark shuffle
Spark memory management
Spark SQL 揭秘
什么是Spark SQL
Spark SQL 特性
Spark SQL 工作原理
Spark Streaming
流数据
Spark Streaming 设计原理
如何实现高可用性
Machine learning on Spark
Scaling out ML algorithms on Spark
End-to-end machine-learning pipelines
Deep learning on Spark using BigDL
BigDL概述
在Spark上如何使用BigDL
本次课程是针对Spark中高级用户的,对SPARK深度的原理解析和高级实践分享,希望您具备一定的Spark 知识技能,并对流式分析及机器学习有一定的兴趣或了解。最后希望此课程能帮助您加速Spark分析以及机器学习的实践,为您的数据科学学习和工作开启一页新篇章。
关于导师
Carson Wang
Carson Wang is a big data software engineer at Intel, focusing on developing and improving new big data technologies. He is an active open source contributor to the Spark and Alluxio projects. Prior to Intel, Carson was an engineer at Microsoft working on cloud computing technologies.
俞育才
英特尔大数据架构师,Spark开源贡献者。10年软件开发经验,熟悉大数据,流计算,存储,虚拟化。曾帮助多家公司构建基于Spark的流处理方案。
Zhichao Li
利智超来自于Intel大数据技术团队,专注于大数据分析领域, Spark contributor。他的同事和他致力于在Apache Spark平台上开发分布式机器学习算法,以满足大数据背景下的机器学习需求。他还为这些分布式机器学习算法在Intel平台上进行优化,以及帮助Intel的客户为他们的业务开发大数据分析程序。
Yiheng Wang
Yiheng Wang is a software development engineer on the Big Data Technology team at Intel who works in the area of big data analytics. He and his colleagues are developing and optimizing distributed machine-learning algorithms (e.g., neural network and logistic regression) on Apache Spark. He also helps Intel customers build and optimize their big data analytics applications.
Daoyuan Wang
王道远,英特尔亚太研发有限公司资深软件工程师,自2014年起参与Spark SQL开发,是Apache Spark开源社区的活跃贡献者。在参与Spark开发之前,他参与了IDH版本Hive的开发。译有《Spark快速大数据分析》一书。
Strata Data Conference北京站正在报名中,点击图片中二维码可登录会议网站,浏览截止到目前为止的讲师名单和已经确认的议题,早期票价优惠期截止到6月9日,尽快注册以确保留位。
- [Strata Data Conference培训课程] Apache Spark高级实践和原理解析
- [Strata Data Conference培训课程] 数据科学精髓:互联网金融实例-量化线上金融信用与欺诈风险的评估
- 分享|Strata Data Conference北京见闻
- Strata Data Conference北京2017精彩继续!
- Strata Data Conference北京大会开始注册!
- Strata + Hadoop World 2天培训课程
- 分享|天云大数据出席Strata Data Conference 国际会议
- Strata Data Conference北京2017大幕开启!
- Strata Data Conference Beijing教学辅导课 [报告厅议题介绍]
- Strata Data Conference早期门票优惠本周五即将截止!
- 重要通知|Strata Data Conference北京站最优惠票价今天截止。
- Strata Data Conference北京站最优惠票价期截止到本周五为止
- Strata Data Conference Beijing教学辅导课 [多功能厅5B+C议题介绍]
- Strata Data Conference Beijing教学辅导课 [多功能厅2议题介绍]
- Strata Data Conference Beijing教学辅导课 [多功能厅8A+8B议题介绍]
- Hadoop高级培训课程大纲-管理员版
- Hadoop高级培训课程大纲-开发者版
- 大数据企业战略规划高级培训课程
- Apache Hadoop 3.0的特性和开发进展的更新 [session]
- 使用R和Apache Spark处理大规模数据 [session]
- 仿网易云音乐播放音乐转盘
- Spinach: 使用Spark SQL进行即席查询 [session]
- 科学领域中的深度学习一览
- [Strata Data Conference培训课程] Apache Spark高级实践和原理解析
- AI应从神经科学中借鉴想法和思路
- 细说分布式Session管理
- [Strata Data Conference培训课程] 数据科学精髓:互联网金融实例-量化线上金融信用与欺诈风险的评估
- 关于如何解释机器学习的一些方法
- 重要通知|Strata Data Conference北京站最优惠票价今天截止。
- 用TensorFlow为图片添加字幕
- Fun Game UVA
- Strata Data Conference北京站最优惠票价期截止到本周五为止