hadoop下利用庖丁分词实现分词+wordcount的环境配置

来源:互联网 发布:php默认编码方式 编辑:程序博客网 时间:2024/06/06 23:19

准备:

下载庖丁分词相关

并把dic目录全放在eclipse工程路径下

在/etc/profile设置dic目录,并且修改庖丁包下面的src目录下paoding-dic-home.properties。。知道字典路径

添加PAODING_DIC_HOME在etc/profile

把庖丁包里的各种jar包放在hadoop下。。。common,hdfs,mapreduce都放了

在eclipse中导入jar包


0 0