在linux上一行代码不用写实现自动采集+hadoop分词
来源:互联网 发布:端口被屏蔽怎么办 编辑:程序博客网 时间:2024/06/06 02:26
在linux上一行代码不用写实现自动采集+hadoop分词
将下面的shell脚本保存成到xxx.sh,然后执行即可
cd /opt/hadoop
mkdir spiderwget -O spider/test.html "http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html"
hadoop fs -mkdir /spider
hadoop fs -put spider/test.html /spider
hadoop jar share/hadoop/mapreduce/wordcount.jar wordcount.wordcount /spider/test.html /fenci2
执行结果如下:
0 0
- 在linux上一行代码不用写实现自动采集+hadoop分词
- ZedBoard学习(6)-System Generator实现串口通信(一行HDL代码都不用写)
- 不用写一行代码,用MFC向导实现的文本编辑器(类似Windows下的记事本)
- 如何不用写一行代码就能学习软件开发
- 不用写一行代码,可视化ssh登录攻击来源
- AI 分析 不用写代码 即可实现
- 不用一行代码实现DBGRIDEh的标题按钮排序!
- Xcode中不用一行代码实现button圆角
- django插件-dj-pagination简单设置实现分页(甚至不用在view上写paginate)
- linux不用符号实现写文件
- 在SVN上实现代码风格自动检查
- 如何实现 linux 在 命令行模式(init 3)状态下不用输入用户名自动登陆
- 如何实现 linux 在 命令行模式(init 3)状态下不用输入用户名自动登陆
- 最简单设置Mdi容器背景图片方法-不用写一行代码(c#)
- IQKeyBoardManager - 不用写一行代码就完美解决IOS开发键盘遮挡的类库
- IQKeyBoardManager - 不用写一行代码就完美解决IOS开发键盘遮挡的类库
- 一行代码写python
- 在Linux上安装Hadoop
- readelf命令
- UML类图几种关系的总结
- 微信公众平台的发展历史
- 自己动手写服务器-2
- oracle学习之:客户端监听配置
- 在linux上一行代码不用写实现自动采集+hadoop分词
- wince2416 更改IP不重启系统
- Android隐藏标题栏问题
- Linux下oracle服务开机自动启动
- iframe里不同连接的跳转
- 史上最全的公众号盈利模式解读
- python 读取csv 简单策略
- 3.mongoDB Shell 基本操作
- Yii2.0-advanced-10—数据库操作1(原生sql)