机器学习H2O AI框架简介
来源:互联网 发布:mac用什么播放器好 编辑:程序博客网 时间:2024/04/29 17:20
机器学习H2O AI框架简介
1. H2O框架
a.底层数据层
底层数据读取Hdfs数据 s3数据 SQL 数据 noSQL数据
s3Amazon Simple Storage Service 亚马逊的云存储结构
Hive其实就是读取HDFS
noSQL:HBase
HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce.虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的执行Hadoop 便利全部数据速度慢 老版本不支持更新操作
Hbase的能够在它的数据库上实时运行,而不是运行MapReduce任务在Hbase中,行是key/value映射的集合,这个映射通过row-key来唯一标识。Hbase利用Hadoop的基础设施,可以利用通用的设备进行水平的扩展。
Hive可以用来进行统计查询,HBase可以用来进行实时查询
b. 计算引擎层
hadoop spark
在hadoop中使用mapreduce 所起的任务只是Map任务
使用sparkling-water将H2O和Spark进行整合
c. 核心运算层
算法引擎:深度学习
计算引擎:基于内存的MapReduce 使用分布式的fork/join框架(java并行框架) 内存管理引擎 :采用列式压缩ColumnarCompression
d.接口层
SDK和 REST API
快速查询R引擎 毫秒级评分引擎
h2o-3/h2o-docs/src/dev/lifecycle.md
H2OApp vs. H2OClientApp
The main class for Standalone H2O isH2OApp.(class)
H2OApp uses a helper class calledH2OStarter(class)
H2O.configureLogging();
H2O.registerExtensions();
// Fire up the H2O Cluster
H2O.main(args);
H2O.registerRestApis(relativeResourcePath);
H2O.finalizeRegistration();
water is from h2o-core and hex is fromh2o-algos.
e 核心组件
MRTask :Map/Reduce styledistributed computation
里边有各种mapreduce方法
(Dtask–TAICountedCompleted – countedCompleted – fork/jointask)
Chunk : ChunkType ChunkName
2. H2O中的数据结构
Frame Frame are only composed of Vecs of the sameVectorGroup
Vec 是由多个Chunck组成 可以并行计算mapreduce MRtask
newMRTask{} { final double _mean = vec.mean();
publicvoid map( Chunk chk ) {
for(int row=0; row < chk._len; row++ )
if(chk.isNA(row) ) chk.set(row,_mean);
}
}.doAll(vec);
Chunck 1000 –100 0000个element one cpu
Key
DKV 分布式Key/values存储
AST : AbstractSyntax Tree
- 机器学习H2O AI框架简介
- h2o机器学习算法框架学习总结
- H2O机器学习框架的学习
- H2O框架简介(转载)
- 深度学习平台H2O简介
- h2o.ai源码解析(1)—项目简介
- 机器学习框架简介
- AI-深度学习框架-应用数学和机器学习基础
- Spark与深度学习框架——H2O、deeplearning4j、SparkNet
- 机器学习框架SciKit-learn简介
- AI时代-机器学习入门
- 苹果又发布一个机器学习框架,帮自家生态里的开发者降低AI门槛
- 使用H2O进行集成学习
- H2O学习笔记(一)—— H2O概述
- H2O学习笔记(二)——H2O Flow
- H2O学习笔记(二)——H2O Flow
- h2o.ai源码解析(2)—启动流程
- h2o.ai源码解析(3)—CPU管理
- 使用Try-with-resources自动关闭资源
- SSIS 参数的值
- SOAP 比对解释
- 设计模式07:桥接模式
- phpstorm 找回历史代码,phpstorm 恢复代码
- 机器学习H2O AI框架简介
- Tensorflow学习: Placeholder占位符
- hdu4723--(How Long Do You Have to Draw)
- i2c 子系统
- Sql语句优化-查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join
- 4412驱动-fasync 异步 (代码还有问题)
- css3之2D转换
- Python报错: python setup.py egg_info" failed with error code 1
- Execute Process Task