spark集群上如何配置深度学习elephas框架的操作流程(shell版)

来源:互联网 发布:mac哪款粉底液好用 编辑:程序博客网 时间:2024/05/16 05:25


这个博客是回答 elephas解析第一篇  中评论区中的问题,我就把自己在一个自己的集群上面,把搭建深度学习框架elephas,theano,keras,tensorflow的操作流程post在这里。我在安装之前的集群信息如下:

  1. 4台ubuntu15的机器,其中一台配置host为master,其他四台为slave02,slave03,slave04.
  2. 在这个4台已经配置好hadoop集群,和spark集群。这一点可以在下面的shell看到,当然在这里不用管hadoop。
  3. 每一台上都已经安装好anaconda。一定要安装这个,不要用内置的python,因为安装这些包在anaconda会省很多力
关于下面的shell脚本说明
  1. 下面的shell脚本是有两个,本文只贴了master上面的shell。slave总共3台,内容都是一样的。
  2. master的前面是安装elephas,theano,keras,tensorflow;后面是spark submit mnist_mlp_spark_CC.py  本地 和集群。
  3. slave 只有安装,所以看完master,就不必看slave了。(因为之前有人问过slave上要不要配置python的依赖包)
  4. 我已经上传pdf文件,下载浏览更方便。(下载)https://pan.baidu.com/s/1mhQuNmK#list/path=%2F


0 0