Hadoop 使用场景
来源:互联网 发布:工具书中的网络词语 编辑:程序博客网 时间:2024/05/29 11:53
- 大数据量存储:分布式存储
- 日志处理: Hadoop擅长这个
- 海量计算: 并行计算
- ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
- 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
- 机器学习: 比如Apache Mahout项目
- 搜索引擎:hadoop + lucene实现
- 数据挖掘:目前比较流行的广告推荐
- 大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
- 数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
- 数据不进行本地缓存(文件很大,且顺序读没有局部性)
- 任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
- 用户细分特征建模
- 个性化广告推荐
- 智能仪器推荐
0 0
- hadoop使用场景
- hadoop使用场景
- hadoop combine 使用场景
- hadoop使用场景
- Hadoop 使用场景
- hadoop使用场景
- hadoop使用场景
- hadoop使用场景
- hadoop使用场景
- 转载:用Hadoop,还是不用Hadoop?(使用Hadoop的场景)
- 淘宝Hadoop集群机器硬件配置及使用场景
- Hadoop各种压缩的应用场景与使用
- Hadoop的应用场景
- hadoop应用场景总结
- hadoop应用场景总结
- [场景] -- 场景使用
- 使用场景
- 使用场景
- 在SAE的Python工程上使用MySQL
- Python 使用单链表实现队列 (基于class, 包含迭代器)
- SQLite3数据库
- ios错误收集
- 【整理】为什么要写博客
- Hadoop 使用场景
- 各种控件的开源项目
- 用javascript获取屏幕高度和宽度等信息
- android ListView包含CheckBox时滑动丢失选中状态的解决
- 标准C++中的string类的用法总结
- Struts跳转后CSS页面样式失效
- svn服务器配置例子
- HDU-小盒子放在格子里-可以旋转
- C++标准库---使用reserve来避免不必要的重新分配