01_05 数据获取和清理概览
来源:互联网 发布:淘宝的大刀和鑫鑫 编辑:程序博客网 时间:2024/06/06 00:23
1、数据获取和清理的内容
(1)脏数据和干净数据
(2)下载文档
(3)读取数据(excel,xml,json,mysql,hdf5,web....)
(4)合并数据
(5)重新构造数据
(6)汇总数据
(7)寻找和替换
(8)数据源
2、数据库连接和列举
ucsDb <-dbConnect(MySQL(),user="genome",host="genome_mysql.cse.ucsc.edu")
result <-dbGetQuery(ucscDb)
result
3、合并数据——merge()
mergeData2<- merge(reviews,solutons,by.x="solution_id",by.y="id",all=TRUE)
head(mergeData2[,1:6],3)
reviews[1,1:6]
4、脏数据和处理过的数据
(1)脏数据/原始数据
数据的来源、很难用来分析、数据分析包括处理、原始数据也许只要处理一次
(2)处理过的数据
可以用来分析的数据,数据处理包括合并、子集、转换等,也许处理有标准、所有处理的步骤都要被记录下来
0 0
- 01_05 数据获取和清理概览
- R Getting and Cleaning Data获取和清理数据
- 获取缓存数据,并清理
- 01_05.border属性
- Flex学习笔记_05 使用组件处理数据和交互_01常用组件
- Flex学习笔记_05 使用组件处理数据和交互_02导航类组件
- android-系统设置中的,清理数据和清理缓存
- dbsetup实现数据准备和清理工作
- 数据预处理_数据清理01
- 01_06 探索性数据分析概览
- 01-数据分析之始末-概览篇
- appium获取手机端页面元素的操作_05
- 应用缓存获取和清理功能实现失败
- 黑马程序员_Java基础_05数组数组拷贝、数据常见问题
- 数据加密技术概览
- 大数据架构概览
- 数据可视化概览
- 大数据技术概览
- libsvm安装及使用
- 敏捷团队高效的完成软件架构设计
- armadillo库之对称矩阵的特征值与特征向量
- 欧拉筛法求欧拉函数
- Android自定义View------柱状统计图
- 01_05 数据获取和清理概览
- 浅谈扩展欧几里得算法
- Linxu网络测试命令
- SQL三个表连接查询
- HDU 1710 二叉树的遍历
- JAVA通过COM接口操作PPT
- [软件人生]一个个人规划
- 【leetcode】Happy Number
- Java中单实例的设计