Hadoop Streaming和Pipes
来源:互联网 发布:西安淘宝模特兼职 编辑:程序博客网 时间:2024/06/06 03:38
原始问题的引出见:http://bbs.hadoopor.com/viewthread.php?tid=542
在论坛里搜索了下,发现了两篇利用C/C++编写mapreduce的文章.如下:
http://bbs.hadoopor.com/thread-256-1-1.html
http://bbs.hadoopor.com/thread-420-1-2.html
一.其中,利用stream的文章中提到,利用stream编写mapreduce程序,其reduce任务要等到所有map任务结束后才能进行,这点不太理解.
二.从两种方法的实现上来看.感觉有点奇怪.在linux下,一般从stdin读入数据认为是管道的方式,而通过socket读入数据为stream方式,但是在hadoop中,貌似其叫法与linux下相反.不知道为什么.
三.从代码可以看出,在hadoop中,stream是利用stdin,而pipes是利用socket.这两者有什么优缺点可以比较下的.
By:guxiangxi
一,二两个问题我也不理解,不止如何回答。第三个问题我更关注一些,因为之前用过一下streaming,感觉不是特别好用,现在的状况还是熟悉C++,但写mapreduce还是用java。正好Pipes正好是我想要的。下面有三处文章可以参考
总结如下:
已经得到证实:pipes 已经从hadoop 中移除。运行$~/hadoop-0.21.0/bin/hadoop,已经看不到pipe的这一项了。
使用上的参考:
1、http://developer.yahoo.com/hadoop/tutorial/module4.html#pipes
2、http://code.google.com/p/hypertable/wiki/MapReduceWithHypertable
转:
- Hadoop Streaming和Pipes
- hadoop中的streaming和pipes
- Hadoop Streaming和Pipes会意
- Hadoop Pipes & Streaming
- Hadoop pipes编程
- hadoop pipes
- Hadoop pipes设计原理
- hadoop pipes编程示例
- hadoop c++ pipes接口实现
- Hadoop Streaming机制
- Hadoop Streaming 编程
- hadoop安装和hadoop pipes编程说明
- Hadoop Streaming高级编程
- hadoop Streaming之aggregate
- Hadoop Pipes
- Hadoop pipes
- hadoop streaming/c++编程指南
- Hadoop pipes编程
- HBase加载大数据
- bulk-load装载hdfs数据到hbase
- Hbse源码分析-HFileOutputFo…
- HADOOP_CLASSPATH设置
- hadoop生态链资源
- Hadoop Streaming和Pipes
- hadoop pipes编程示例
- hadoop c++ pipes接口实现
- 流式计算之Storm简介
- MapR初探
- ACL-NLP顶级会议
- Hadoop发展现状乱而稳定的解读
- hadoop pipes
- hadoop常见配置含义