R读写数据

来源:互联网 发布:网络用语爸爸什么意思 编辑:程序博客网 时间:2024/06/11 21:31
先设置工作目录,把文本文件放在该目录下  或者是用全路径
设置工作目录的方法:
1.命令行

使用getwd函数来显示当前工作目录,使用setwd函数改变当前目录:

> getwd()

[1] "/home/paul/research"

> setwd("Bayes")

> getwd()

[1] "/home/paul/research/Bayes"

2.界面操作

Windows

从主菜单中选择“文件”(File)→“改变工作目录”(Change dir...)。


1.   Read.table()read.csv()关系

没什么不一样的,两个读取,底层统一都是scan。相当于scan的两种封装接口

2.   读文本    

用于读入表格(表)类型的数据,同时生成数据框对象。

读入的数据要求有规则的分隔符,默认有:空格、TAB、换行符、回车符;其它的分隔符,通过sep=来进行指定。

read.table(file, header = FALSE, sep = "",

           dec = ".", row.names, col.names,

           as.is = !stringsAsFactors,

           na.strings = "NA", colClasses = NA, nrows = -1,

           skip = 0, check.names = TRUE, fill = !blank.lines.skip,

           strip.white = FALSE, blank.lines.skip = TRUE,

           comment.char = "#",

           allowEscapes = FALSE, flush = FALSE,

           stringsAsFactors = default.stringsAsFactors(),

           fileEncoding = "", encoding = "unknown")

file:指定读入的文件,或者文件所在地址;

header:是否读入列名,默认是不读入;

sep:来进行指定分隔符:读入的数据要求有规则的分隔符,可以是:空格、TAB、换行符、回车符;

as.is:读入的字符是否转换成因子,默认所有读入的字符都转换成因子;

colClasses:指定列的数据类型格式

header=TRUE 第一行是否是列的名称,默认是TRUE

stringsAsFactors= 是否字符转化成因子,默认是true

row.names=c()指定各行的名称,缺省值是(1,2,3····)

col.names=C()指定列的名称,如果读入是文件没有头,可以指定,缺省值是(V1V2V3····)

skip=N 从文件第几行开始读入数据

nrows=N 读入的最大行数

na.strings=c()指定什么样的字符表示值缺少

comment.char=‘’ 指定评论的开始字符,默认是#

dec= 指定小数点数

blank.lines.skip  如果为TRUE,忽略空白行

encoding=指定非non-ASCII的编码规则


> x=read.table("a.txt")     

> x

  V1 V2

1  1  2

2  2  3

3  3  2

4  4  4

5  1  2

6  3  2

7  2  3

读取工作目录下的a文本

注:有可能出现一个问题

警告信息:

In read.table("a.txt") :

  readTableHeader在读取'a.txt'时遇到了不完全的最后一行

遇到这样的问题,只要在数据的最后添加一个回车就可以了。


读取工作目录下的a文本

> x=read.table("E:\\b.txt")   

> x

   V1  V2

1  222 333

2   2   3

3   2   3

4   2   3

5   4   4

读取E盘目录下的b文本


3.Excel

方法1

xls另存为csv格式然后用read.csv

具体过程如下:

存到excel的文档:


> read.csv("E://b.csv",head=T)

  X22 X33

1   2   3

2   2   3

3   2   3

4   4   4

> read.csv("E://b.csv",head=F)

  V1 V2

1 222 333

2  2  3

3  2  3

4  2  3

5  4  4

header = TTURE)是默认的状态,在这默认状态下,输出的data矩阵是一个3乘以4的矩阵,第一行作为了data的名字,如果header = FFALSE),则会显示原始的矩阵结果。

方法2

xls另存为txt格式然后用read.table

如例子所示:


方法3

打开EXCEL,全选里面的内容,点击复制,然后在R中输入一下命令:


使用这种方法的时候一定要注意复制 全选excel的内容,然后复制,剪切板里面没有内容是无法运行的!

方法4

安装RODBC包,再通过ODBC读


4.R脚本

4.1编写R脚本

R脚本十分简单,在脚本中用R写自定义写函数 脚本后缀保存成.r

如:


4.2运行R脚本

source(“d:\\h.r”) 运行h.r脚本 

> source("h.r")

   V1 V2

1 liu shao

2 liu kai

3 li bing

注:在脚本中打印要用print()函数



0 0
原创粉丝点击