使用BigDL在Apache Spark上进行大规模分布式深度学习 [session]
来源:互联网 发布:p2p网络摄像机 编辑:程序博客网 时间:2024/06/09 17:57
Strata Data Conference北京站大会还有一个月即将召开,
有需求的同学还请抓紧时间,
点击二维码即可登录会议官网报名。
使用BigDL在Apache Spark上进行大规模分布式深度学习
讲师:Zhichao Li (Intel), Shengsheng Huang (Intel), Yiheng Wang (Intel)
14:00–14:40 Friday, 2017-07-14
AI应用 (AI applications)
地点: 报告厅(Auditorium)
观众水平 (Level): 中级
必要预备知识
A basic understanding of deep learning, Spark, Scala, and Python
描述
BigDL是基于Apache Spark的开源分布式深度学习框架(https://github.com/intel-analytics/BigDL)。它为Spark提供了深入学习功能的原生支持,同时为现成的使用单节点志强Xeon CPU的开源深度学习框架(如Caffeh和Torch)带来了数量级的性能速度提升,并为它们提供了基于Spark架构的对深度学习任务的高效的水平扩展的能力;此外,它还允许数据科学家使用熟悉的工具(包括Python和Notebook等)来对大数据进行分布式深度学习分析。
在这次演讲中,我们将演示大数据用户和数据科学家如何使用BigDL以分布式方式对海量数据进行深度学习分析(如图像识别、对象检测、NLP等)。这可以让他们使用已有的大数据集群(例如Apache Hadoop和Spark)来作为数据存储、数据处理和挖掘、特征工程、传统的(非深度)机器学习和深度学习工作负载的统一数据分析平台。
此外,我们还将提供与现有深入学习框架(如PyCaffe和Tensorflow)有相似风格的培训和推断的Python API。大家会觉得使用BigDL Python API开发深入学习应用程序非常得简单直接。BigDL还提供了丰富的可视化功能,让用户能理解、监控、检查和操做其模型和处理过程。我们将通过实例演示这些便利性。
讲师介绍:
Zhichao Li (Intel)
利智超来自于Intel大数据技术团队,专注于大数据分析领域, Spark contributor。他的同事和他致力于在Apache Spark平台上开发分布式机器学习算法,以满足大数据背景下的机器学习需求。他还为这些分布式机器学习算法在Intel平台上进行优化,以及帮助Intel的客户为他们的业务开发大数据分析程序。
Shengsheng Huang (Intel)
Shengsheng (Shane) Huang is a software architect at Intel and an Apache Spark committer and PMC member, leading the development of large-scale analytical applications and infrastructure on Spark in Intel. Her area of focus is big data and distributed machine learning, especially deep (convolutional) neural networks. Previously at NUS (National University of Singapore), her research interests are large-scale vision data analysis and statistical machine learning.
Yiheng Wang (Intel)
Yiheng Wang is a software development engineer on the Big Data Technology team at Intel who works in the area of big data analytics. He and his colleagues are developing and optimizing distributed machine-learning algorithms (e.g., neural network and logistic regression) on Apache Spark. He also helps Intel customers build and optimize their big data analytics applications.
- 使用BigDL在Apache Spark上进行大规模分布式深度学习 [session]
- 使用Apache Spark和BigDL来构建深度学习驱动的大数据分析
- Spark上的深度学习框架BigDL 介绍
- spark-BigDl:深度学习之神经网络编写
- spark-BigDl:深度学习之lenet5
- 基于Spark的分布式深度学习框架BigDL开源了!
- 使用Spark\/BigDL高级机器学习实现寿险业务再发现 [session]
- 使用R和Apache Spark处理大规模数据 [session]
- 开源深度学习库BigDL在阿里云E-MapReduce上的实践
- AWS上使用MXNet进行分布式深度学习
- 分布式TensorFlow:在Spark上将谷歌的深度学习库进行尺度变换
- Intel开源深度学习库BigDL:Non GPU on Spark
- 基于Hadoop集群的大规模分布式深度学习
- 使用Spring Session 进行分布式Session管理
- 在Spark和Hadoop上做大规模数据科学
- 在大规模分布式集群上用caffe训练mnist模型
- 在Apache Hadoop和Spark上加速大数据加密 [session]
- 为Apache Spark准备的深度学习
- [session] 使用开源人工智能和机器学习工具训练现实世界的信用模型
- [session] 欺诈的潜伏性: 如何利用大数据进行反欺诈检测
- [session] GeaBase:蚂蚁金服大规模实时分布式图数据库
- 什么是机器学习工程师?
- SDK + FinGraph + Go:用一手行为数据和图谱信息创造商业价值 [session]
- 使用BigDL在Apache Spark上进行大规模分布式深度学习 [session]
- HAP:多流动态实时分析系统 [session]
- Pluto:一款分布式异构深度学习框架 [session]
- 人工智能:合作还是攻击
- 人工智能工业应用痛点及解决思路 [session]
- Apache Kudo: 1.0版和未来 [session]
- 使用Spark\/BigDL高级机器学习实现寿险业务再发现 [session]
- 基于深度学习的网络表示 [session]
- 数据结构思维 翻译完成