R文件下所有数据读取与文本字符处理
来源:互联网 发布:剑三捏脸数据成女南风 编辑:程序博客网 时间:2024/05/21 09:09
#清楚环境变量
rm(list = ls())
#加载所需要的包
library(tidyr)
library(dplyr)
library(data.table)
library(readr)
library(readxl)
library(rJava)
library(xlsxjars)
library(xlsx)
library(devtools)
library(stringr)
#设置路径
setwd('C:\\Users\\Administrator\\Desktop\\crawl\\phonebind')
#显示路径下所有文件
dir()
#读入文件
test1 <- read.csv(dir()[1])
num1 =length(dir())
for(i in 2:num1){
test2 <- read.csv(dir()[i])
test1 <- rbind(test1,test2)
}
test3 <- read.csv('C:\\Users\\Administrator\\Desktop\\crawl\\binddata\\phone.csv')
test <- rbind(test1,test3)
result <- data.frame(test$phone)
write.csv(result,'山东村委电话.csv')
num2 <- nrow(test1)
#读取第一个文件,转化为data.frame格式
data1 <- strsplit(test1$phone[1],split = '\n\n')
data1 <- data.frame(data1)
colnames(data1) <- c('phone')
#进行for循环用\n\n进行分割
for(i in 2:num2){
data2 <- strsplit(test1$phone[i],split = '\n\n')
data2 <- data.frame(data2)
colnames(data2) <- c('phone')
data1 <- rbind(data1,data2)
}
#转化为字符型
data1$phone <- as.character(data1$phone)
#模糊匹配
result <- data1$phone[which(grepl(pattern = '0',data1$phone))]
#转化为data.frame格式
result <- data.frame(result)
#重新赋值列名
colnames(result) <- c('phone')
write.csv(result,'phone.csv')
rm(list = ls())
#加载所需要的包
library(tidyr)
library(dplyr)
library(data.table)
library(readr)
library(readxl)
library(rJava)
library(xlsxjars)
library(xlsx)
library(devtools)
library(stringr)
#设置路径
setwd('C:\\Users\\Administrator\\Desktop\\crawl\\phonebind')
#显示路径下所有文件
dir()
#读入文件
test1 <- read.csv(dir()[1])
num1 =length(dir())
for(i in 2:num1){
test2 <- read.csv(dir()[i])
test1 <- rbind(test1,test2)
}
test3 <- read.csv('C:\\Users\\Administrator\\Desktop\\crawl\\binddata\\phone.csv')
test <- rbind(test1,test3)
result <- data.frame(test$phone)
write.csv(result,'山东村委电话.csv')
num2 <- nrow(test1)
#读取第一个文件,转化为data.frame格式
data1 <- strsplit(test1$phone[1],split = '\n\n')
data1 <- data.frame(data1)
colnames(data1) <- c('phone')
#进行for循环用\n\n进行分割
for(i in 2:num2){
data2 <- strsplit(test1$phone[i],split = '\n\n')
data2 <- data.frame(data2)
colnames(data2) <- c('phone')
data1 <- rbind(data1,data2)
}
#转化为字符型
data1$phone <- as.character(data1$phone)
#模糊匹配
result <- data1$phone[which(grepl(pattern = '0',data1$phone))]
#转化为data.frame格式
result <- data.frame(result)
#重新赋值列名
colnames(result) <- c('phone')
write.csv(result,'phone.csv')
阅读全文
0 0
- R文件下所有数据读取与文本字符处理
- R 字符函数 文本处理
- R读取路径下的所有文件和统计
- R语言文本读取异常处理
- QT下GPS数据读取与处理!!!
- linux c 读取并处理文件夹下的所有文件
- R语言读取文件数据
- python读取串口、网络编程、文本处理与文件操作
- 读取文件中的所有数据
- 【Java】读取其下所有文件夹与文件的路径
- java读取某个文件夹下所有文件与文件夹
- 【Java】读取其下所有文件夹与文件的路径
- 读取文件夹下所有文件
- 读取一个文件夹下所有的txt文件,并保存到一个txt文本中
- 读取文件中所有的字符
- 用JAVA处理文本与二进制数据混合大文件
- 【python图像处理】txt文件数据的读取与写入
- Windows下读取文件夹下所有文件
- 项目: 老王开枪
- 获取二维数组中的元素(PHP 5.5新增函数),兼容低版本处理
- eharts散点图 调整点的颜色和大小。
- spring小结
- Windows 包管理器 Chocolatey
- R文件下所有数据读取与文本字符处理
- where you go?
- 自己写的一个分页效果
- Linux基础
- 一篇文章了解爬虫技术现状
- webrtc 学习博客
- mac版idea报错:Information:java: javacTask: 源发行版 1.8 需要目标发行版 1.8
- 网络传输协议中的和校验函数
- Android WebView使用总结