H2O机器学习框架的学习

来源:互联网 发布:修改oracle数据库时间 编辑:程序博客网 时间:2024/04/29 18:05

介绍:



H2O是开源的,分布式的,基于内存的,可扩展的机器学习和预测分析框架,适合在企业环境中构建大规模机器学习模型。H2O核心代码使用Java编写,数据和模型通过分布式 Key/Value 存储在各个集群节点的内存中。H2O的算法使用Map/Reduce框架实现,并使用了Java Fork/Join框架来实现多线程。


相关资源:

官网:https://www.h2o.ai/h2o/

github:https://github.com/h2oai/h2o-3

测试数据下载地址:http://data.h2o.ai/

首次接触指导文档:https://github.com/h2oai/h2o-3/blob/master/h2o-docs/src/product/flow/README.md


H2O的产品:

   H2O Flow:开源的分布式的机器学习框架,可以通过web页面快速构建模型;
   Deep Water:自动化机器学习框架,后端支持TensorFlow、MXNet以及Caffe.
   Sparkling Water:可扩展的H2O的机器学习算法与Spark的功能相结合。 使用Sparkling Water,用户可以从Scala / R / Python驱动计算,并利用H2O Flow UI,为应用程序开发人员提供了理想的机器学习平台。
   Stream:实时机器学习智能应用解决方案;
   Driverless AI:无人驾驶技术平台;


学习说明:

    首先通过指导文档对页面布局有一定的了解,稍后可以通过用例自己创建一个模型来验证;

    机器学习的参数调整和设置仍需要专业知识;

前台页面的不足:图表不够直观,中文资料较少,存在一定的入门门槛;


原创粉丝点击