Rwordseg包安装过程以及简单的中文分词
来源:互联网 发布:linux服务器重启 编辑:程序博客网 时间:2024/05/17 03:15
以此文献给那些被Rwordseg安装失败折磨的小天使们
废话不多说,网上关于Rwordseg包安装的文章太多了,正所谓乱花渐欲迷人眼,绝大多数文章都没能带领我们最终装好这个包,本人也深受这些文章所害,为了安装好花了很多时间,最终功夫不负有心人,终于装好了(此处应该好好庆祝一番),于是为了解救折翅的小天使们,将安装过程共十步整理如下:(大家内心肯定在呼喊:好长啊~~~~能不能少一点步骤。我只能说:不行,没得商量!)
1. 在安装Rwordseg包之前,要先检查是否安装了rJava包,这是最复杂的过程,网上有很多种方法,但是为了避免产生误导,我只放我亲测下载成功的方法。
从http://www.oracle.com/technetwork/java/javase/downloads/index.html 下载与电脑和R版本一致的JDK,此处标记小星星★,注意:一定要和电脑还有Rstudio的版本一致,Rstudio的版本可以在Tools-Global options里面看到。
2. 打开下载好的jdk.exe,将jdk安装在和Rstudio一样的目录下,比如:Rstdio在C:\Program Files\Rstudio下,那么就把jdk安装在C:\Program Files下。
3. 安装过程中会有两次选择安装路径,第一次就是上一步中提到的选择jdk的安装路径,第二次为安装jre的路径,此处再标记一个小星星★,注意:此路径不能和C:\Program Files\JAVA一致(如果一致的话jre的文件会覆盖掉jdk的文件,所以务必要注意),可以在JAVA下新建子文件夹,如:jre-9
4. 安装完JDK后,需要配置环境变量,点击:计算机→属性→高级系统设置→高级→环境变量,还不清楚的小天使们可以参考下图。
5. 在系统变量框点击新建,在弹出的窗口中变量名填:JAVA_HOME,变量值填写jdk的安装目录(我的是 C:\Program Files\Java\jdk-9)
6. 在系统变量框中找到Path变量→编辑,在变量值最后输入 %JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;(此处又要标记小星星★,注意:原来Path的变量值末尾有没有;号,如果没有,先输入;号再输入上面的代码,要注意是英文状态下的分号)
7. 在系统变量框点击新建,在弹出的窗口中变量名填:CLASSPATH,变量值填写.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;(万能的小星星又要出现了★,注意:最前面有一点),系统变量配置完毕。
8. 检验是否配置成功,运行cmd 输入 java -version (java 和 -version 之间有空格)若显示版本信息,则说明安装和配置成功。
接下来就可以在Rstudio里面愉快的安装并加载rJava包了,代码如下:
install.packages("rJava")Sys.setenv(JAVA_HOME='C:\\Program Files\\Java\\jre-9')#注意路径需要是自己安装jre的路径。library(rJava)
9. 在用八步安装完rJava包之后,终于轮到安装主角Rwordseg包了,但也并不是一马平川,由于Rwordseg包是放在Rforge上的,而不是CRAN上,因此不能直接用install.packages去安装,我试了下网上所说的
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org", type = "source")
然而,并没有什么用,还是下载不成功(此时痛不欲生,装个包就这么难???),于是我用了下载离线包的方法,网址为http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip
10. 打开与Rstudio对应版本的R Gui,点击packages-install package from local files,加载Rwordseg包,路径为刚才下载的Rwordseg_0.2-1.zip所在的路径。
这时,我们终于可以安心的打出:
library(Rwordseg)
最后,顺便测试下Rwordseg包的分词效果。
> textvec <- "你安装成功Rwordseg包了吗?"> segmentCN(textvec)[1] "你" "安装" "成功" "Rwordseg" "包" "了" "吗"
很明显,我们并不希望把Rwordseg和包分开,我们还可以自定义词语,让它们生生世世在一起,永不分离。
> insertWords("Rwordseg包")> segmentCN(textvec)[1] "你" "安装" "成功" "Rwordseg包" "了" "吗"
果然,在我的安排下,它们快乐的在一起了~~~
至于嫌弃insertWords逐个打进去太麻烦的同学,我还有installDict()送给他,可以自行下载搜狗的细胞词库,然后载入,就可以按照词库的词语分词啦,这里就不介绍了。
希望各位小天使们都可以快乐的用装好的包做进一步的分析~
- Rwordseg包安装过程以及简单的中文分词
- R语言中文分词Rwordseg的安装
- R语言-Rwordseg中文分词包安装步骤
- R中中文分词包Rwordseg的下载与离线安装
- Rwordseg包的安装
- 中文文本挖掘包tm、tmcn、Rwordseg、Rweibo的安装
- 中文分词工具Rwordseg
- 中文分词Rwordseg
- R语言︱文本挖掘之中文分词包——Rwordseg包(原理、功能、详解)
- 【R文本挖掘】中文分词Rwordseg
- 【R文本挖掘】中文分词Rwordseg
- 【R文本挖掘】中文分词Rwordseg
- R文本挖掘-中文分词Rwordseg
- 在最新版的R语言中安装Rwordseg包
- 64位的R中使用Rwordseg做文本分词遇到的安装问题
- linux 下sphinx的中文分词包mmseg安装
- sphinx的安装配置和中文分词包coreseek
- sphinx的安装配置和中文分词包coreseek
- 两个有序链表序列的合并
- 对象的组合
- [iOS]网络之使用第三方库AFNetworking
- 浅谈java Scanner类(一)
- Unity在Android Activity中加载的时期测试
- Rwordseg包安装过程以及简单的中文分词
- Zabbix相关配置
- FastJson--阿里巴巴公司开源的速度最快的Json和对象转换工具
- SIP proxy and SIP gateway
- win10下安装sqlserver2012无法找到配置管理器
- mysql插入与主键相同值的另一个字段
- C# string类型和byte[]类型相互转换
- 【51Nod1679】连通率
- Nginx正向代理配置