R语言文本分析(1)
来源:互联网 发布:有网址怎么搜淘宝店 编辑:程序博客网 时间:2024/05/17 23:57
R语言文本分析(1)
R语言在数据挖掘中应用广泛,并有越来越火的趋势。R语言进行文本挖掘也是相当好使。作为一个R语言新手,追随着众多牛人的脚步,尝试使用R语言进行文本挖掘分析,过程应是充满艰辛,道路曲折坎坷之处Write down以记录之。
我从Text Analysis with R for Students of Literature (by Matthew L. Jockers)开始,一步一步走起~
环境配置
R的安装与配置教程很多,不提。
文本分析第一个尝试
简单的导入、分割、查看以及分析尝试。
setwd("R/tm/1st/")text <- scan(file = "../data/test.txt", what="character", sep = "\n")start.metadata<- text[1:start -1]end.metadata <- text[(end+1):length(text)]metadata <- c(start.metadata, end.metadata)novel.lines <- text[start:end]novel <- paste(novel.lines, collapse = " ")novel.lower <- tolower(novel)moby.words.l <- strsplit(novel.lower, "\\W") # split wordsmoby.words <- unlist(moby.words.l)not.blanks <- which(moby.words != "")moby.words <- moby.words[not.blanks]length(moby.words[which(moby.words=="whale")])
0 0
- R语言文本分析(1)
- R语言-文本分析
- R语言文本分析(2)
- R语言文本分析(3)
- R语言文本分析(4)
- R语言文本分析(5)
- R语言文本分析篇
- R语言の文本分析
- 红楼梦文本分析-R语言
- R语言文本分析问题
- R语言:实现文本分析实例(基础篇)
- 【R语言】文本挖掘-情感分析
- [R语言]文本分类(1)
- R语言文本挖掘(1):分词(Rwordseg)
- R语言文本分类
- R语言做文本挖掘 Part5情感分析
- R语言做文本挖掘 Part5情感分析
- R语言做文本挖掘 Part5情感分析
- VBS脚本备份桌面文档到指定目录,同时统计文档的信息。
- 基于Spring的Junit测试
- 内核头文件使用
- Linux下查看文件和文件夹大小
- Apio2016 游记
- R语言文本分析(1)
- Xml序列化器
- poj1064 二分搜索
- 【Stanford机器学习笔记】10-Support Vector Machines
- 四个月工作总结
- Spring声明式事务管理
- linux基础(14)--输入输出重定向、文件查找--RHEL6.5
- 菜刀ASP 修改文件时间名抓包
- System.Data.SqlClient.SqlError: 备份集中的数据库备份与现有的 'XXX' 数据库不同。