Mahout---协同过滤算法示例

来源:互联网 发布:linux网络配置 编辑:程序博客网 时间:2024/06/11 12:25
                                       ***基于物品的协同过滤***

Step 1:
准备样本集item.txt

1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107,5.04,101,5.04,103,3.04,104,4.54,106,4.05,101,4.05,102,3.05,103,2.05,104,4.05,105,3.55,106,4.0

Step 2:
在node11节点上执行命令,建立样本文件

vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/item.txt

这里写图片描述

Step 3:
在三个节点执行命令,启动zookeeper
这里写图片描述
这里写图片描述
这里写图片描述

Step 4:
在node11节点上执行命令,启动HDFS和Yarn

start-all.sh

这里写图片描述

在node12节点上执行命令,启动Resourcemanager

yarn-daemon.sh start resourcemanager

这里写图片描述

Step 5:
打开浏览器,输入URL进行查看HDFS
192.168.80.11:50070
192.168.80.12:50070
这里写图片描述
这里写图片描述

打开浏览器,输入URL进行查看Yarn
192.168.80.11:8088
192.168.80.12:8088
这里写图片描述
这里写图片描述

Step 6:
在node11节点上执行命令,将文件上传到HDFS中

hadoop fs -mkdir /itemCFhadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/item.txt /itemCFhadoop fs -ls /itemCF

这里写图片描述

Step 7:
在node11节点上执行命令,运行Mahout

mahout recommenditembased -s SIMILARITY_LOGLIKELIHOOD  -i /itemCF/item.txt  -o /itemCF/tuijian --numRecommendations 5

这里写图片描述

Step 8:
执行命令,查看运行结果

hadoop fs -cat /itemCF/tuijian/part-r-00000

这里写图片描述

原创粉丝点击