程序博客网 > mac充电器怎么用

数据清洗与收集week1

来源：互联网发布：mac充电器怎么用编辑：程序博客网时间：2024/05/16 00:36

整个过程先瞄下先

2 下载文件

亲身痛苦的实验，发现在window中不需用curl方法，自己还在那实验半天，哎哎，另外，如果还不行的话，将https改为http可能会有效一些，https比http多了个安全协议

读取当地文件

read.table()中一定要设置分隔符sep="",

而read,csv()中默认设置分隔符为comma,header=true,因为csv中是以逗号为分隔符的

读取excel数据

读取XML数据

library('XML')
fileurl <- "http://www.w3schools.com/xml/simple.xml" 输入url地址

doc <-xmlTreeParse(fileurl,useInternal=TRUE) 好像是读取全部文件的意思，若不加后面那个useInternal,则会出现很多属性

rootNode <- xmlRoot(doc)所有的结点类似于the entire document

xmlName(rootNode) 根结点名字

names（rootNode)次结点名字

不知道htmlTreeParse与xmlTreeParse之间的区别呢

读取json数据

读入jsonlite包：library(jsonlite)

读取数据：jsondata <- fromJSON("网站地址“）

查看名字：names(jsondata)

names(jsondata$owner)查看owner下的所有对象名

jsondata$owner$login查看owner下的login

myjson<- toJSON(iris,pretty=TRUE)转换成JSON形式，若无pretty=TRUE,则看起来很难受，所有数据全在一行，有的话，会很好看

cat(myjson)附用法 ？+要查的东西，也可以查函数，如？cat

cat(…, file=”", sep=” “, append=FALSE)

Print output to the screen or to a file. Use cat to print information to an end-user from a function. cat is also useful for writing information that is being processed or generated, one or more lines at a time, to a file.

iris2 <- fromJSON(myjson)

head(iris2) 取前六个 ,与之对应的是tail()取后几个

用data.table来读数据

继承了data.,frame（例子中DT即我写的da)

所有能在data,.frame上工作的函数也能在data,,table上工作

用c 写的所以日快

提取子集，分组和更新数据的时候表现的更更快

data table 可以像data frame一样使用

如library(data.table)

da=data.frame(x=rnorm(9),y=rep(c("a","b","c"),each=3),z=rnorm(9))此处将data.frame改为data.table也是一样的

可以通过tables()来查看其内存情况

抽取行：da[2,]抽第二行 da[da$y=="a"] da[c(2,3)]抽取第二三行

抽取列 da[,c(2,3)]在dataframe中是抽取第二和第三列，而在table中则是显示 [1] 2 3不知何意呢，如下可见，用列的表示方法得出不是想象中这样

以下是列的用法

此处;就是两个expression的意思，前者为print(10),后者为将5赋值给k

此处当用data.frame形式来加列的话，会在内存中复制一份，再将列加上去，于是内存中有了两份数据，对于大数据而言，很不幸的说呢

而用table形式则无此不良后果，但也会有危险，如下下张图中所示

先写下，再看代码da1<-da da[,y:=2] :=一定要有的，结果如下

除上面那个注意点之外呢，它的强大之处在于

当然更可以这样

更可以以更快的速度来读取

0 0

mac充电器怎么用

mac充电器怎么用

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子我想变瘦怎么办总是看不惯别人怎么办健身后脑勺疼怎么办婆婆不爱干活怎么办每天家务干不完怎么办手臂关节劳损怎么办手臂劳损疼痛怎么办劳损肩膀疼痛怎么办半月板劳损怎么办肌肉率低怎么办中年人驼背怎么办胳膊肘劳损怎么办健身房出汗多怎么办喜欢上私教怎么办练腿后酸痛怎么办健身后体重增加怎么办脸上粉刺多怎么办? 暴食后肚子难受怎么办 11岁就有大肚子怎么办定型发胶洗不掉怎么办发胶洗不掉怎么办腰椎歪了怎么办家里没有发蜡怎么办人矮了怎么办健身出汗多怎么办绒面鞋被雨打湿怎么办杯子打不开怎么办杯子吸住打不开怎么办感冒健身胸闷怎么办上海市民健身卡怎么办露天泳池下雨怎么办小孩摔跤脸破皮怎么办身体负担重怎么办百度手机号被盗怎么办海黄盘黑了怎么办飞机上想听歌怎么办婴儿口鼻喷奶怎么办骨头易碎怎么办 vrcam离线怎么办 360找不到网页怎么办肺活量不足怎么办